From baa099d66656cb79f6192b98e3deb4dfc6741234 Mon Sep 17 00:00:00 2001
From: xiaodaigh <zhuojia.dai@gmail.com>
Date: Sun, 9 Aug 2020 00:34:16 +1000
Subject: [PATCH 1/9] refactoring for better nse

---
 DESCRIPTION                                   |     9 +-
 NAMESPACE                                     |    25 -
 R/add_chunk.r                                 |     5 +-
 R/chunk_mapper.r                              |    91 +-
 R/clapply.r                                   |     0
 R/cmap.r                                      |    94 +-
 R/collect.r                                   |    66 +-
 R/data.table.r                                |    50 +-
 R/dplyr_verbs.r                               |    84 +-
 R/get_chunk.r                                 |    43 +-
 R/map-deprecated.r                            |    85 -
 R/map2.r                                      |    16 -
 R/play.r                                      |    12 +
 R/srckeep.disk.frame.r                        |    16 +-
 man/chunk_group_by.Rd                         |    20 +-
 man/cmap.Rd                                   |    50 +-
 man/cmap2.Rd                                  |     3 -
 man/collect.Rd                                |     2 +-
 man/create_chunk_mapper.Rd                    |     2 +-
 man/create_dplyr_mapper.Rd                    |    11 -
 man/dplyr_verbs.Rd                            |    15 -
 man/play.Rd                                   |    16 +
 man/srckeep.Rd                                |     5 -
 misc/disk.frame-report.html                   | 26696 +++++++++-------
 .../datatables-crosstalk.css                  |    16 +
 25 files changed, 15474 insertions(+), 11958 deletions(-)
 create mode 100644 R/clapply.r
 delete mode 100644 R/map-deprecated.r
 create mode 100644 R/play.r
 delete mode 100644 man/create_dplyr_mapper.Rd
 create mode 100644 man/play.Rd

diff --git a/DESCRIPTION b/DESCRIPTION
index d235b10b..93184e16 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -1,7 +1,7 @@
 Type: Package
 Package: disk.frame
 Title: Larger-than-RAM Disk-Based Data Manipulation Framework
-Version: 0.3.7
+Version: 0.4.0
 Date: 2020-07-07
 Authors@R: c(
   person("Dai", "ZJ", email = "zhuojia.dai@gmail.com", role = c("aut", "cre")),
@@ -25,17 +25,16 @@ Imports:
     pryr (>= 0.1.4),
     stringr (>= 1.4.0),
     fst (>= 0.8.0),
-    globals (>= 0.12.4),
     future (>= 1.14.0),
     data.table (>= 1.12.2),
     crayon (>= 1.3.4),
     bigreadr (>= 0.2.0),
     bit64,
-    benchmarkme
+    benchmarkme,
+    purrr (>= 0.3.2)
 Depends:
     R (>= 3.4),
-    dplyr (>= 1.0.0),
-    purrr (>= 0.3.2)
+    dplyr (>= 1.0.0)
 Suggests:
     testthat (>= 2.1.0),
     nycflights13,
diff --git a/NAMESPACE b/NAMESPACE
index d93b80bf..77e4b782 100644
--- a/NAMESPACE
+++ b/NAMESPACE
@@ -17,7 +17,6 @@ S3method(colnames,disk.frame)
 S3method(compute,disk.frame)
 S3method(delayed,disk.frame)
 S3method(distinct,disk.frame)
-S3method(do,disk.frame)
 S3method(filter,disk.frame)
 S3method(full_join,disk.frame)
 S3method(get_chunk,disk.frame)
@@ -30,18 +29,9 @@ S3method(hard_arrange,disk.frame)
 S3method(hard_group_by,data.frame)
 S3method(hard_group_by,disk.frame)
 S3method(head,disk.frame)
-S3method(imap,default)
-S3method(imap_dfr,default)
-S3method(imap_dfr,disk.frame)
 S3method(inner_join,disk.frame)
 S3method(lazy,disk.frame)
 S3method(left_join,disk.frame)
-S3method(map,default)
-S3method(map,disk.frame)
-S3method(map2,default)
-S3method(map2,disk.frame)
-S3method(map_dfr,default)
-S3method(map_dfr,disk.frame)
 S3method(merge,disk.frame)
 S3method(mutate,disk.frame)
 S3method(names,disk.frame)
@@ -67,8 +57,6 @@ S3method(transmute,disk.frame)
 export(IQR_df.chunk_agg.disk.frame)
 export(IQR_df.collected_agg.disk.frame)
 export(add_chunk)
-export(add_count.disk.frame)
-export(add_tally.disk.frame)
 export(all_df.chunk_agg.disk.frame)
 export(all_df.collected_agg.disk.frame)
 export(any_df.chunk_agg.disk.frame)
@@ -90,9 +78,7 @@ export(cmap_dfr)
 export(collect_list)
 export(colnames)
 export(copy_df_to)
-export(count.disk.frame)
 export(create_chunk_mapper)
-export(create_dplyr_mapper)
 export(csv_to_disk.frame)
 export(delayed)
 export(delete)
@@ -107,16 +93,12 @@ export(get_chunk)
 export(get_chunk_ids)
 export(hard_arrange)
 export(hard_group_by)
-export(imap)
-export(imap_dfr)
 export(insert_ceremony)
 export(is_disk.frame)
 export(lazy)
 export(length_df.chunk_agg.disk.frame)
 export(length_df.collected_agg.disk.frame)
 export(make_glm_streaming_fn)
-export(map)
-export(map2)
 export(map_by_chunk_id)
 export(max_df.chunk_agg.disk.frame)
 export(max_df.collected_agg.disk.frame)
@@ -151,10 +133,8 @@ export(shardkey_equal)
 export(show_boilerplate)
 export(show_ceremony)
 export(srckeep)
-export(srckeepchunks)
 export(sum_df.chunk_agg.disk.frame)
 export(sum_df.collected_agg.disk.frame)
-export(tally.disk.frame)
 export(var_df.chunk_agg.disk.frame)
 export(var_df.collected_agg.disk.frame)
 export(write_disk.frame)
@@ -179,14 +159,11 @@ importFrom(data.table,setDT)
 importFrom(data.table,setkey)
 importFrom(data.table,setkeyv)
 importFrom(data.table,timetaken)
-importFrom(dplyr,add_count)
-importFrom(dplyr,add_tally)
 importFrom(dplyr,anti_join)
 importFrom(dplyr,arrange)
 importFrom(dplyr,bind_rows)
 importFrom(dplyr,collect)
 importFrom(dplyr,compute)
-importFrom(dplyr,count)
 importFrom(dplyr,distinct)
 importFrom(dplyr,do)
 importFrom(dplyr,filter)
@@ -208,7 +185,6 @@ importFrom(dplyr,select)
 importFrom(dplyr,semi_join)
 importFrom(dplyr,summarise)
 importFrom(dplyr,summarize)
-importFrom(dplyr,tally)
 importFrom(dplyr,tbl_vars)
 importFrom(dplyr,transmute)
 importFrom(fs,dir_create)
@@ -227,7 +203,6 @@ importFrom(future,nbrOfWorkers)
 importFrom(future,plan)
 importFrom(future,sequential)
 importFrom(future.apply,future_lapply)
-importFrom(globals,findGlobals)
 importFrom(glue,glue)
 importFrom(jsonlite,fromJSON)
 importFrom(jsonlite,toJSON)
diff --git a/R/add_chunk.r b/R/add_chunk.r
index 215feb85..08fee3d2 100644
--- a/R/add_chunk.r
+++ b/R/add_chunk.r
@@ -116,9 +116,10 @@ add_chunk <- function(df, chunk, chunk_id = NULL, full.names = FALSE, ...) {
     
     data.table::setDT(check_vars)
     if(nrow(check_vars[is.na(new_chunk)]) > 0) {
+      vars_strings = paste0(check_vars[is.na(new_chunk), colnames], collapse=',\n  ')
       warning(
-        glue::glue(
-          "these variables are in the disk.frame but not in the new chunk:  \n {paste0(check_vars[is.na(new_chunk), colnames], collapse=',\n  ')}"))
+        sprintf(
+          "these variables are in the disk.frame but not in the new chunk:  \n %s", vars_strings))
     }
     if(nrow(check_vars[is.na(existing_df)]) > 0){
       warning(glue::glue("these variables are in the new chunk but not in the existing disk.frame: {paste0(check_vars[is.na(existing_df), colnames], collapse=', ')}"))
diff --git a/R/chunk_mapper.r b/R/chunk_mapper.r
index 2063252a..9f4ea4f8 100644
--- a/R/chunk_mapper.r
+++ b/R/chunk_mapper.r
@@ -33,57 +33,54 @@
 #' @param as.data.frame force the input chunk of a data.frame; needed for dtplyr
 #' @importFrom rlang enquos quo
 #' @export
-create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = TRUE) {
-  return_func <- function(.data, ...) {
-    if (!is.null(warning_msg)) {
-      warning(warning_msg)
+create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FALSE) {
+  if(as.data.frame) {
+    warning("`as.data.frame` is deprecated in create_chunk_mapper")
+  } 
+  
+  return(function(.data, ...) {
+    if(!is.null(warning_msg)) {
+      print(warning_msg)
     }
     
     
-    quo_dotdotdot = rlang::enquos(...)
+    # you need to use list otherwise the names will be gone
+    sub_dotdotdot = substitute(list(...))
     
-    # this is designed to capture any global stuff
-    vars_and_pkgs = future::getGlobalsAndPackages(quo_dotdotdot)
-    data_for_eval_tidy = force(vars_and_pkgs$globals)
+    code = paste0(deparse(sub_dotdotdot), collapse = "")
+    # code will be in the form of "list(...)"
+    code = substr(code, 6, nchar(code)-1)
     
-    res = cmap(.data, ~{
-      
-      this_env = environment()
-      
-      if(length(data_for_eval_tidy) > 0) {
-        for(i in 1:length(data_for_eval_tidy)) {
-          assign(names(data_for_eval_tidy)[i], data_for_eval_tidy[[i]], pos = this_env)
-        }
-      }
-      
-      lapply(quo_dotdotdot, function(x) {
-        attr(x, ".Environment") = this_env
-      })
-      
-      if(as.data.frame) {
-        if("grouped_df" %in% class(.x)) {
-          code = rlang::quo(chunk_fn(.x, !!!quo_dotdotdot))
-        } else {
-          code = rlang::quo(chunk_fn(as.data.frame(.x), !!!quo_dotdotdot))
-        }
-      } else {
-        code = rlang::quo(chunk_fn(.x, !!!quo_dotdotdot))
+    if (code == "NULL") {
+      globals_and_pkgs = future::getGlobalsAndPackages(str2lang("chunk_fn()"))
+    } else {
+      globals_and_pkgs = future::getGlobalsAndPackages(str2lang(sprintf("chunk_fn(%s)", code)))
+    }
+    
+    
+    global_vars = globals_and_pkgs$globals
+    
+    env = parent.frame()
+    
+    done = identical(env, globalenv())
+    
+    # keep adding global variables
+    
+    while(!done) {
+      tmp_globals_and_pkgs = future::getGlobalsAndPackages(sub_dotdotdot, envir = env)
+      new_global_vars = tmp_globals_and_pkgs$globals
+      for (name in setdiff(names(new_global_vars), names(global_vars))) {
+        global_vars[name] = new_global_vars[[name]]
       }
       
-      # ZJ: we need both approaches. TRUST ME
-      # TODO better NSE at some point need dist
-      tryCatch({
-        return(rlang::eval_tidy(code))
-      }, error = function(e) {
-        as_label_code = rlang::as_label(code)
-        if(as_label_code == "chunk_fn(...)") {
-          stop(glue::glue("disk.frame has detected a syntax error in \n\n`{code}`\n\n. If you believe your syntax is correct, raise an issue at https://github.com/xiaodaigh/disk.frame with a MWE"))
-        } else {
-          # likely to be dealing with data.tables
-          return(eval(parse(text=as_label_code), envir = this_env))
-        }
-      })
-    }, lazy = TRUE)
-  }
-  return_func
-}
\ No newline at end of file
+      done = identical(env, globalenv())
+      env = parent.env(env)
+    }
+    
+    globals_and_pkgs$globals = global_vars
+    
+    attr(.data, "recordings") = c(attr(.data, "recordings"), list(globals_and_pkgs))
+    
+    .data
+  })
+}
diff --git a/R/clapply.r b/R/clapply.r
new file mode 100644
index 00000000..e69de29b
diff --git a/R/cmap.r b/R/cmap.r
index e1700066..fe04516f 100644
--- a/R/cmap.r
+++ b/R/cmap.r
@@ -53,69 +53,61 @@ cmap <- function(.x, .f, ...) {
 #' @rdname cmap
 #' @importFrom future getGlobalsAndPackages
 #' @export
-cmap.disk.frame <- function(.x, .f, ..., outdir = NULL, keep = NULL, chunks = nchunks(.x), compress = 50, lazy = TRUE, overwrite = FALSE, vars_and_pkgs = future::getGlobalsAndPackages(.f, envir = parent.frame()), .progress = TRUE) {
-  .f = purrr::as_mapper(.f)
-  if(lazy) {
-    attr(.x, "lazyfn") = 
-      c(
-        attr(.x, "lazyfn"), 
-        list(
-          list(
-            func = .f, 
-            vars_and_pkgs = vars_and_pkgs, 
-            dotdotdot = list(...)
-          )
+cmap.disk.frame <- function(.x, .f, ..., outdir = NULL, 
+                            keep = NULL, 
+                            chunks = nchunks(.x), 
+                            compress = 50, 
+                            lazy = TRUE, 
+                            overwrite = FALSE, 
+                            .progress = TRUE) {
+  if(typeof(.f) == "language") {
+    if(requireNamespace("purrr")) {
+      .f = purrr::as_mapper(.f)
+    } else {
+      code = paste0(deparse(substitute(.f)), collapse = "")
+      stop(
+        sprintf(
+          "in cmap(.x, %s), it appears you are using {purrr} syntax but do not have {purrr} installed. Try `install.packages('purrr')`",
+          code
         )
       )
-    return(.x)
+    }
   }
   
-  if(!is.null(outdir)) {
+  if (lazy) {
+    ..f = create_chunk_mapper(.f)
+    return(..f(.x))
+  } else {
+    # not lazy
+    if (is.null(outdir)) {
+      stop("cmap(...) error -- `lazy` = FALSE but `outdir` is not specified") 
+    }
+    
     overwrite_check(outdir, overwrite)
-  }
-  
-  stopifnot(is_ready(.x))
-  
-  keep1 = attr(.x,"keep", exact=TRUE)
-  
-  if(is.null(keep)) {
-    keep = keep1
-  }
-  
-  path <- attr(.x, "path")
-  files <- list.files(path, full.names = TRUE)
-  files_shortname <- list.files(path)
-  
-  keep_future = keep
-  
-  cid = get_chunk_ids(.x, full.names = TRUE)
-  
-  dotdotdot = list(...)
-  
-  res = future.apply::future_lapply(1:length(files), function(ii, ...) {
-    #res = lapply(1:length(files), function(ii) {
-    ds = disk.frame::get_chunk(.x, cid[ii], keep=keep_future, full.names = TRUE)
     
-    res = .f(ds, ...)
+    path <- attr(.x, "path")
+    files <- list.files(path, full.names = TRUE)
+    files_shortname <- list.files(path)
     
-    #res = do.call(.f, c(ds, dotdotdot))
+    cids = get_chunk_ids(.x, full.names = T, strip_extension = F)
     
-    if(!is.null(outdir)) {
+    # compute
+    # TODO refactor that into a write_disk.frame()
+    future.apply::future_lapply(1:length(files), function(ii, ...) {
+      ds = get_chunk(.x, cids[ii], full.names = TRUE)
+      
+      res = .f(ds, ...)
+      
       if(nrow(res) == 0) {
-        warning(glue::glue("The output chunk has 0 row, therefore chunk {ii} NOT written"))
+        warning(sprintf("The output chunk has 0 row, therefore chunk %d NOT written", ii))
       } else {
-        fst::write_fst(res, file.path(outdir, files_shortname[ii]), compress)
+        out_chunk_name = file.path(outdir, files_shortname[ii])
+        fst::write_fst(res, out_chunk_name, compress)
       }
-      return(ii)
-    } else {
-      return(res)
-    }
-  }, ...)
-  
-  if(!is.null(outdir)) {
+      NULL
+    }, ...)
+    
     return(disk.frame(outdir))
-  } else {
-    return(res)
   }
 }
 
diff --git a/R/collect.r b/R/collect.r
index 66aac392..fbcc286a 100644
--- a/R/collect.r
+++ b/R/collect.r
@@ -11,8 +11,6 @@
 #'   hence parallel = FALSE is a better choice
 #' @param ... not used
 #' @importFrom data.table data.table as.data.table
-#' @importFrom furrr future_map_dfr future_options
-#' @importFrom purrr map_dfr
 #' @importFrom dplyr collect select mutate
 #' @return collect return a data.frame/data.table
 #' @examples
@@ -24,18 +22,20 @@
 #' delete(cars.df)
 #' @export
 #' @rdname collect
-collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"lazyfn"))) {
-  cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
-  #cids = as.integer(get_chunk_ids(x))
-  if(nchunks(x) > 0) {
-    if(parallel) {
-      furrr::future_map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE))
-    } else {
-      purrr::map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE))
-    }
+collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
+  cids = get_chunk_ids(x, full.names = T, strip_extension = F)
+  
+  if (parallel) {
+    list_of_data.table = future.apply::future_lapply(cids, function(cid) {
+      get_chunk(x, cid, full.names = TRUE)
+    })
   } else {
-    data.table()
+    list_of_data.table = lapply(cids, function(cid) {
+      get_chunk(x, cid, full.names = TRUE)
+    })
   }
+  
+  data.table::rbindlist(list_of_data.table)
 }
 
 #' @param simplify Should the result be simplified to array
@@ -51,25 +51,25 @@ collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"lazyfn"))) {
 #' # clean up
 #' delete(cars.df)
 collect_list <- function(x, simplify = FALSE, parallel = !is.null(attr(x,"lazyfn"))) {
-  cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
-  
-  
-  if(nchunks(x) > 0) {
-    res <- NULL
-    if (parallel) {
-      #res = furrr::future_map(1:nchunks(x), ~get_chunk(x, .x))
-      res = future.apply::future_lapply(cids, function(.x) {
-        get_chunk(x, .x, full.names = TRUE)
-      })
-    } else {
-      res = purrr::map(cids, ~get_chunk(x, .x, full.names = TRUE))
-    }
-    if (simplify) {
-      return(simplify2array(res))
-    } else {
-      return(res)
-    }
-  } else {
-    list()
-  }
+  error("do it")
+  # cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
+  # 
+  # 
+  # if(nchunks(x) > 0) {
+  #   res <- NULL
+  #   if (parallel) {
+  #     res = future.apply::future_lapply(cids, function(.x) {
+  #       get_chunk(x, .x, full.names = TRUE)
+  #     })
+  #   } else {
+  #     res = purrr::map(cids, ~get_chunk(x, .x, full.names = TRUE))
+  #   }
+  #   if (simplify) {
+  #     return(simplify2array(res))
+  #   } else {
+  #     return(res)
+  #   }
+  # } else {
+  #   list()
+  # }
 }
diff --git a/R/data.table.r b/R/data.table.r
index 5459e4cb..0e5ce503 100644
--- a/R/data.table.r
+++ b/R/data.table.r
@@ -9,7 +9,6 @@
 #' @import fst 
 #' @importFrom future.apply future_lapply
 #' @importFrom data.table rbindlist 
-#' @importFrom globals findGlobals
 #' @export
 #' @examples 
 #' cars.df = as.disk.frame(cars)
@@ -19,31 +18,30 @@
 #' # clean up
 #' delete(cars.df)
 `[.disk.frame` <- function(df, ..., keep = NULL, rbind = TRUE, use.names = TRUE, fill = FALSE, idcol = NULL) {
-  keep_for_future = keep
-  
-  dotdotdot = substitute(...()) #this is an alist
-  
-  ag = globals::findGlobals(dotdotdot)
-  ag = setdiff(ag, "") # "" can cause issues with future
-  
-  res = future.apply::future_lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {
-  #lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {
-    chunk = get_chunk(df, chunk_id, keep = keep_for_future)
-    data.table::setDT(chunk)
-    expr <- quote(chunk)
-    expr <- c(expr, dotdotdot)
-    res <- do.call(`[`, expr)
-    res
-  }, future.globals = c("df", "keep_for_future", "dotdotdot", ag), future.packages = c("data.table","disk.frame")
-  )
-  
-  if(rbind & all(sapply(res, function(x) "data.frame" %in% class(x)))) {
-    rbindlist(res, use.names = use.names, fill = fill, idcol = idcol)
-  } else if(rbind)  {
-    unlist(res)
-  } else {
-    res
-  }
+  # keep_for_future = keep
+  # 
+  # dotdotdot = substitute(...()) #this is an alist
+  # 
+  # ag = globals::findGlobals(dotdotdot)
+  # ag = setdiff(ag, "") # "" can cause issues with future
+  # 
+  # res = future.apply::future_lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {
+  #   chunk = get_chunk(df, chunk_id, keep = keep_for_future)
+  #   data.table::setDT(chunk)
+  #   expr <- quote(chunk)
+  #   expr <- c(expr, dotdotdot)
+  #   res <- do.call(`[`, expr)
+  #   res
+  # }, future.globals = c("df", "keep_for_future", "dotdotdot", ag), future.packages = c("data.table","disk.frame")
+  # )
+  # 
+  # if(rbind & all(sapply(res, function(x) "data.frame" %in% class(x)))) {
+  #   rbindlist(res, use.names = use.names, fill = fill, idcol = idcol)
+  # } else if(rbind)  {
+  #   unlist(res)
+  # } else {
+  #   res
+  # }
 }
 
 # Solutions from https://stackoverflow.com/questions/57122960/how-to-use-non-standard-evaluation-nse-to-evaluate-arguments-on-data-table?answertab=active#tab-top
diff --git a/R/dplyr_verbs.r b/R/dplyr_verbs.r
index 8ea3c4ea..2126f081 100644
--- a/R/dplyr_verbs.r
+++ b/R/dplyr_verbs.r
@@ -23,19 +23,17 @@
 #' 
 #' # clean up cars.df
 #' delete(cars.df)
-select.disk.frame <- function(.data, ...) {
-  quo_dotdotdot = rlang::enquos(...)
-  cmap(.data, ~{
-    code = rlang::quo(dplyr::select(.x, !!!quo_dotdotdot))
-    rlang::eval_tidy(code)
-  }, lazy = TRUE)
-}
+select.disk.frame <- create_chunk_mapper(dplyr::select)
+
+# comment out code; to be removed when it's no longer needed
+# select.disk.frame <- function(.data, ...) {
+#   quo_dotdotdot = rlang::enquos(...)
+#   cmap(.data, ~{
+#     code = rlang::quo(dplyr::select(.x, !!!quo_dotdotdot))
+#     rlang::eval_tidy(code)
+#   }, lazy = TRUE)
+# }
 
-#' Kept for backwards-compatibility to be removed in 0.3
-#' @export
-create_dplyr_mapper = function() {
-  stop("create_dplyr_mapper has been deprecated. Please use create_chunk_mapper instead")
-}
 
 #' @export
 #' @rdname dplyr_verbs
@@ -72,16 +70,16 @@ arrange.disk.frame =create_chunk_mapper(dplyr::arrange, warning_msg="`arrange.di
 chunk_arrange <- create_chunk_mapper(dplyr::arrange)
 
 
-#' @export
-#' @importFrom dplyr tally
-#' @rdname dplyr_verbs
-tally.disk.frame <- create_chunk_mapper(dplyr::tally)
-
-
-#' @export
-#' @importFrom dplyr count
-#' @rdname dplyr_verbs
-count.disk.frame <- create_chunk_mapper(dplyr::count)
+#' #' @export
+#' #' @importFrom dplyr tally
+#' #' @rdname dplyr_verbs
+#' tally.disk.frame <- create_chunk_mapper(dplyr::tally)
+#' 
+#' 
+#' #' @export
+#' #' @importFrom dplyr count
+#' #' @rdname dplyr_verbs
+#' count.disk.frame <- create_chunk_mapper(dplyr::count)
 
 #' #' @export
 #' #' @importFrom dplyr add_count
@@ -107,10 +105,10 @@ chunk_summarize <- create_chunk_mapper(dplyr::summarize)
 chunk_summarise <- create_chunk_mapper(dplyr::summarise)
 
 
-#' @export
-#' @rdname dplyr_verbs
-#' @importFrom dplyr do
-do.disk.frame <- create_chunk_mapper(dplyr::do)
+#' #' @export
+#' #' @rdname dplyr_verbs
+#' #' @importFrom dplyr do
+#' do.disk.frame <- create_chunk_mapper(dplyr::do)
 
 
 #' @export
@@ -161,37 +159,3 @@ chunk_ungroup = create_chunk_mapper(dplyr::ungroup)
 glimpse.disk.frame <- function(.data, ...) {
   glimpse(head(.data, ...), ...)
 }
-
-# Internal methods
-# @param .data the data
-# @param cmd the function to record
-record <- function(.data, cmd){
-  attr(.data,"lazyfn") <- c(attr(.data,"lazyfn"), list(cmd))
-  .data
-}
-
-# Internal methods
-# @param .data the disk.frame
-# @param cmds the list of function to play back
-play <- function(.data, cmds=NULL) {
-  for (cmd in cmds){
-    if (typeof(cmd) == "closure") {
-      .data <- cmd(.data)
-    } else {
-      # create a temporary environment 
-      an_env = new.env(parent = environment())
-      
-      ng = names(cmd$vars_and_pkgs$globals)
-      
-      if(length(ng) > 0) {
-        for(i in 1:length(cmd$vars_and_pkgs$globals)) {
-          g = cmd$vars_and_pkgs$globals[[i]]
-          assign(ng[i], g, pos = an_env)
-        }
-      }
-      
-      .data <- do.call(cmd$func, c(list(.data),cmd$dotdotdot), envir = an_env)
-    }
-  }
-  .data
-}
diff --git a/R/get_chunk.r b/R/get_chunk.r
index 1e3cfcbd..c4aa2f2e 100644
--- a/R/get_chunk.r
+++ b/R/get_chunk.r
@@ -26,38 +26,18 @@ get_chunk <- function(...) {
 #' @export
 get_chunk.disk.frame <- function(df, n, keep = NULL, full.names = FALSE, ...) {
   stopifnot("disk.frame" %in% class(df))
-  keep_chunks = attr(df, "keep_chunks", exact=TRUE)
-  
-  # print(names(attr(df, "lazyfn")[[1]]$vars_and_pkgs$globals))
-  # stop("ok")
-  
-  # TODO relax this
-  # if(!is.null(keep_chunks)) {
-  #   # browser()
-  #   # n_int = as.integer(n)
-  #   # 
-  #   # if(is.na(n_int)) {
-  #   #   if(as.character(n) %in% get_chunk_ids(df)[keep_chunks]) {
-  #   #     return(NULL)
-  #   #   } else if(normalizePath(as.character(n)) %in% sapply(get_chunk_ids(df, full.names = TRUE)[keep_chunks],normalizePath)) {
-  #   #     return(NULL)
-  #   #   }
-  #   # } else {
-  #   #   if(!n %in% keep_chunk) {
-  #   #     return(NULL)
-  #   #   }
-  #   # }
-  # }
+  # keep_chunks = attr(df, "keep_chunks", exact=TRUE)
   
   path = attr(df,"path", exact=TRUE)
   
   # all the variables to keep in the attr from a previous srckeep
-  keep1 = attr(df,"keep", exact=TRUE)
+  keep1 = attr(df, "keep", exact=TRUE)
   
-  cmds = attr(df,"lazyfn", exact=TRUE)
+  recordings = attr(df, "recordings", exact=TRUE)
   filename = ""
   
   if (typeof(keep) == "closure") {
+    # sometimes purrr::keep is picked up
     keep = keep1
   } else if(!is.null(keep1) & !is.null(keep)) {
     if (length(setdiff(keep, keep1)) > 0) {
@@ -89,7 +69,7 @@ get_chunk.disk.frame <- function(df, n, keep = NULL, full.names = FALSE, ...) {
     }
   }
   
-  # if the file you are looking for don't exist
+  # if the file you are looking for doesn't exist
   if (!fs::file_exists(filename)) {
     warning(glue("The chunk {filename} does not exist; returning an empty data.table"))
     notbl <- data.table()
@@ -97,17 +77,18 @@ get_chunk.disk.frame <- function(df, n, keep = NULL, full.names = FALSE, ...) {
     return(notbl)
   }
 
-  if (is.null(cmds)) {
-    if(typeof(keep)!="closure") {
-      fst::read_fst(filename, columns = keep, as.data.table = TRUE,...)
-    } else {
+  if (is.null(recordings)) {
+    if(typeof(keep)=="closure") {
       fst::read_fst(filename, as.data.table = TRUE,...)
+    } else {
+      fst::read_fst(filename, columns = keep, as.data.table = TRUE,...)
     }
   } else {
     if(typeof(keep)!="closure") {
-      play(fst::read_fst(filename, columns = keep, as.data.table = TRUE,...), cmds)
+      play(fst::read_fst(filename, as.data.table = TRUE,...), recordings)
     } else {
-      play(fst::read_fst(filename, as.data.table = TRUE,...), cmds)
+      play(fst::read_fst(filename, columns = keep, as.data.table = TRUE,...), recordings)
+      
     }
   }
 }
diff --git a/R/map-deprecated.r b/R/map-deprecated.r
deleted file mode 100644
index bac52e3d..00000000
--- a/R/map-deprecated.r
+++ /dev/null
@@ -1,85 +0,0 @@
-#' @export
-#' @rdname cmap
-map <- function(.x, .f, ...) {
-  UseMethod("map")
-}
-
-#' @export
-#' @rdname cmap
-map.disk.frame <- function(...) {
-  warning("map(df, ...) where df is a disk.frame has been deprecated. Please use cmap(df,...) instead")
-  cmap.disk.frame(...)
-}
-
-#' @export
-#' @rdname cmap
-map.default <- function(.x, .f, ...) {
-  purrr::map(.x, .f, ...)
-}
-
-
-#' @export
-#' @rdname cmap
-imap_dfr <- function(.x, .f, ..., .id = NULL) {
-  UseMethod("imap_dfr")
-}
-
-#' @export
-#' @rdname cmap
-imap_dfr.disk.frame <- function(...) {
-  warning("imap_dfr(df, ...) where df is disk.frame is deprecated. Please use cimap_dfr(df, ...) instead")
-  cimap_dfr.disk.frame(...)
-}
-
-#' @export
-#' @rdname cmap
-imap_dfr.default <- function(.x, .f, ..., .id = NULL) {
-  purrr::imap_dfr(.x, .f, ..., .id = .id)
-}
-
-#' @export
-#' @rdname cmap
-#' @examples
-#' cars.df = as.disk.frame(cars)
-#' 
-#' # .x is the chunk and .y is the ID as an integer
-#' 
-#' # lazy = TRUE support is not available at the moment
-#' cimap(cars.df, ~.x[, id := .y], lazy = FALSE)
-#' 
-#' cimap_dfr(cars.df, ~.x[, id := .y])
-#' 
-#' # clean up cars.df
-#' delete(cars.df)
-imap <- function(.x, .f, ...) {
-  UseMethod("imap")
-}
-
-imap.disk.frame <- function(...) {
-  warning("imap(df,..) where df is disk.frame is deprecated. Use cimap(df, ...) instead")
-  cimap.disk.frame(...)
-}
-
-#' @export
-#' @rdname cmap
-imap.default <- function(.x, .f, ...) {
-  purrr::imap(.x, .f, ...)
-}
-
-#' @rdname cmap
-#' @param .id not used
-#' @export
-map_dfr.disk.frame <- function(...) {
-  warning("map_dfr(df, ...) where df is disk.frame is deprecated. Please use cmap_dfr instead")
-  cmap_dfr.disk.frame(...)
-}
-
-map_dfr <- function(.x, .f, ..., .id = NULL) {
-  UseMethod("map_dfr")
-}
-
-#' @export
-#' @rdname cmap
-map_dfr.default <- function(.x, .f, ..., .id = NULL) {
-  purrr::map_dfr(.x, .f, ..., .id = .id)
-}
\ No newline at end of file
diff --git a/R/map2.r b/R/map2.r
index 99f0c698..643d0ac4 100644
--- a/R/map2.r
+++ b/R/map2.r
@@ -26,22 +26,6 @@ cmap2 <- function(.x, .y, .f, ...){
   UseMethod("cmap2")
 }
 
-#' @export
-#' @rdname cmap2
-map2 <- function(.x, .y, .f, ...){
-  UseMethod("map2")
-}
-
-#' @export
-map2.default <- function(.x, .y, .f, ...) {
-  purrr::map2(.x,.y,.f,...)
-}
-
-#' @export
-map2.disk.frame <- function(...) {
-  warning("map2.disk.frame(df, df1, ..) where df is disk.frame is deprecated. Use cmap(df, df1, ...) instead")
-  cmap2.disk.frame(...)
-}
 
 #' @export
 #' @importFrom pryr do_call
diff --git a/R/play.r b/R/play.r
new file mode 100644
index 00000000..9f3f4011
--- /dev/null
+++ b/R/play.r
@@ -0,0 +1,12 @@
+#' Play the recorded lazy operations
+#' @param dataframe A data.frame
+#' @param recordings A recording the expression, globals and packages using create_chunk_mapper
+play <- function(dataframe, recordings) {
+  for(recording in recordings) {
+    tmp_env = list2env(recording$globals)
+    one_recording_as_string = paste0(deparse(recording$expr), collapse = "")
+    code = str2lang(sprintf("dataframe %%>%% %s", one_recording_as_string))
+    dataframe = eval(code, envir = tmp_env)
+  }
+  dataframe
+}
\ No newline at end of file
diff --git a/R/srckeep.disk.frame.r b/R/srckeep.disk.frame.r
index 54aef73a..1cfc1b2a 100644
--- a/R/srckeep.disk.frame.r
+++ b/R/srckeep.disk.frame.r
@@ -21,11 +21,11 @@ srckeep <- function(diskf, selections, ...) {
 #' @param chunks The chunks to load
 #' @rdname srckeep
 #' @export
-srckeepchunks <- function(diskf, chunks, ...) {
-  stopifnot("disk.frame" %in% class(diskf))
-  # TODO relax this
-  stopifnot(is.integer(chunks))
-  
-  attr(df,"keep_chunks") = chunks
-  diskf
-}
+# srckeepchunks <- function(diskf, chunks, ...) {
+#   stopifnot("disk.frame" %in% class(diskf))
+#   # TODO relax this
+#   stopifnot(is.integer(chunks))
+#   
+#   attr(df,"keep_chunks") = chunks
+#   diskf
+# }
diff --git a/man/chunk_group_by.Rd b/man/chunk_group_by.Rd
index f06836c2..cbe17485 100644
--- a/man/chunk_group_by.Rd
+++ b/man/chunk_group_by.Rd
@@ -5,7 +5,10 @@
 \alias{chunk_summarise}
 \alias{chunk_group_by}
 \alias{chunk_ungroup}
-\title{Group by within each disk.frame}
+\title{#' @export
+#' @importFrom dplyr tally
+#' @rdname dplyr_verbs
+tally.disk.frame <- create_chunk_mapper(dplyr::tally)}
 \usage{
 chunk_summarize(.data, ...)
 
@@ -21,11 +24,26 @@ chunk_ungroup(.data, ...)
 \item{...}{passed to dplyr::group_by}
 }
 \description{
+#' @export
+#' @importFrom dplyr count
+#' @rdname dplyr_verbs
+count.disk.frame <- create_chunk_mapper(dplyr::count)
+#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame <- create_chunk_mapper(dplyr::add_count)
+
 The disk.frame group by operation perform group WITHIN each chunk. This is
 often used for performance reasons. If the user wishes to perform group-by,
 they may choose to use the `hard_group_by` function which is expensive as it
 reorganizes the chunks by the shard key.
 }
+\details{
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame <- create_chunk_mapper(dplyr::add_tally)
+}
 \seealso{
 hard_group_by group_by
 }
diff --git a/man/cmap.Rd b/man/cmap.Rd
index fc06d9cd..8479a2d4 100644
--- a/man/cmap.Rd
+++ b/man/cmap.Rd
@@ -1,5 +1,5 @@
 % Generated by roxygen2: do not edit by hand
-% Please edit documentation in R/cmap.r, R/map-deprecated.r
+% Please edit documentation in R/cmap.r
 \name{cmap}
 \alias{cmap}
 \alias{cmap.disk.frame}
@@ -13,16 +13,6 @@
 \alias{lazy.disk.frame}
 \alias{delayed}
 \alias{chunk_lapply}
-\alias{map}
-\alias{map.disk.frame}
-\alias{map.default}
-\alias{imap_dfr}
-\alias{imap_dfr.disk.frame}
-\alias{imap_dfr.default}
-\alias{imap}
-\alias{imap.default}
-\alias{map_dfr.disk.frame}
-\alias{map_dfr.default}
 \title{Apply the same function to all chunks}
 \usage{
 cmap(.x, .f, ...)
@@ -37,7 +27,6 @@ cmap(.x, .f, ...)
   compress = 50,
   lazy = TRUE,
   overwrite = FALSE,
-  vars_and_pkgs = future::getGlobalsAndPackages(.f, envir = parent.frame()),
   .progress = TRUE
 )
 
@@ -78,26 +67,6 @@ lazy(.x, .f, ...)
 delayed(.x, .f, ...)
 
 chunk_lapply(...)
-
-map(.x, .f, ...)
-
-\method{map}{disk.frame}(...)
-
-\method{map}{default}(.x, .f, ...)
-
-imap_dfr(.x, .f, ..., .id = NULL)
-
-\method{imap_dfr}{disk.frame}(...)
-
-\method{imap_dfr}{default}(.x, .f, ..., .id = NULL)
-
-imap(.x, .f, ...)
-
-\method{imap}{default}(.x, .f, ...)
-
-\method{map_dfr}{disk.frame}(...)
-
-\method{map_dfr}{default}(.x, .f, ..., .id = NULL)
 }
 \arguments{
 \item{.x}{a disk.frame}
@@ -118,17 +87,15 @@ imap(.x, .f, ...)
 
 \item{overwrite}{if TRUE removes any existing chunks in the data}
 
-\item{vars_and_pkgs}{variables and packages to send to a background session. This is typically automatically detected}
-
 \item{.progress}{A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}}
 
-\item{.id}{not used}
-
 \item{use.names}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{fill}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{idcol}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
+
+\item{vars_and_pkgs}{variables and packages to send to a background session. This is typically automatically detected}
 }
 \description{
 Apply the same function to all chunks
@@ -166,17 +133,6 @@ cmap_dfr(cars.df, ~.x[1,])
 collect(lazy(cars.df, ~.x[1,]))
 collect(delayed(cars.df, ~.x[1,]))
 
-# clean up cars.df
-delete(cars.df)
-cars.df = as.disk.frame(cars)
-
-# .x is the chunk and .y is the ID as an integer
-
-# lazy = TRUE support is not available at the moment
-cimap(cars.df, ~.x[, id := .y], lazy = FALSE)
-
-cimap_dfr(cars.df, ~.x[, id := .y])
-
 # clean up cars.df
 delete(cars.df)
 }
diff --git a/man/cmap2.Rd b/man/cmap2.Rd
index 721dd80e..2a03f241 100644
--- a/man/cmap2.Rd
+++ b/man/cmap2.Rd
@@ -2,14 +2,11 @@
 % Please edit documentation in R/map2.r, R/map_by_chunk_id.r
 \name{cmap2}
 \alias{cmap2}
-\alias{map2}
 \alias{map_by_chunk_id}
 \title{`cmap2` a function to two disk.frames}
 \usage{
 cmap2(.x, .y, .f, ...)
 
-map2(.x, .y, .f, ...)
-
 map_by_chunk_id(.x, .y, .f, ..., outdir)
 }
 \arguments{
diff --git a/man/collect.Rd b/man/collect.Rd
index 520157ea..bf6651b9 100644
--- a/man/collect.Rd
+++ b/man/collect.Rd
@@ -6,7 +6,7 @@
 \alias{collect.summarized_disk.frame}
 \title{Bring the disk.frame into R}
 \usage{
-\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "lazyfn")))
+\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "recordings")))
 
 collect_list(x, simplify = FALSE, parallel = !is.null(attr(x, "lazyfn")))
 
diff --git a/man/create_chunk_mapper.Rd b/man/create_chunk_mapper.Rd
index 0702093d..7be02cea 100644
--- a/man/create_chunk_mapper.Rd
+++ b/man/create_chunk_mapper.Rd
@@ -4,7 +4,7 @@
 \alias{create_chunk_mapper}
 \title{Create function that applies to each chunk if disk.frame}
 \usage{
-create_chunk_mapper(chunk_fn, warning_msg = NULL, as.data.frame = TRUE)
+create_chunk_mapper(chunk_fn, warning_msg = NULL, as.data.frame = FALSE)
 }
 \arguments{
 \item{chunk_fn}{The dplyr function to create a mapper for}
diff --git a/man/create_dplyr_mapper.Rd b/man/create_dplyr_mapper.Rd
deleted file mode 100644
index a486be28..00000000
--- a/man/create_dplyr_mapper.Rd
+++ /dev/null
@@ -1,11 +0,0 @@
-% Generated by roxygen2: do not edit by hand
-% Please edit documentation in R/dplyr_verbs.r
-\name{create_dplyr_mapper}
-\alias{create_dplyr_mapper}
-\title{Kept for backwards-compatibility to be removed in 0.3}
-\usage{
-create_dplyr_mapper()
-}
-\description{
-Kept for backwards-compatibility to be removed in 0.3
-}
diff --git a/man/dplyr_verbs.Rd b/man/dplyr_verbs.Rd
index 9a259740..cfebebb4 100644
--- a/man/dplyr_verbs.Rd
+++ b/man/dplyr_verbs.Rd
@@ -8,11 +8,6 @@
 \alias{transmute.disk.frame}
 \alias{arrange.disk.frame}
 \alias{chunk_arrange}
-\alias{tally.disk.frame}
-\alias{count.disk.frame}
-\alias{add_count.disk.frame}
-\alias{add_tally.disk.frame}
-\alias{do.disk.frame}
 \alias{distinct.disk.frame}
 \alias{chunk_distinct}
 \alias{glimpse.disk.frame}
@@ -32,16 +27,6 @@
 
 chunk_arrange(.data, ...)
 
-tally.disk.frame(.data, ...)
-
-count.disk.frame(.data, ...)
-
-add_count.disk.frame(.data, ...)
-
-add_tally.disk.frame(.data, ...)
-
-\method{do}{disk.frame}(.data, ...)
-
 \method{distinct}{disk.frame}(...)
 
 chunk_distinct(.data, ...)
diff --git a/man/play.Rd b/man/play.Rd
new file mode 100644
index 00000000..d252ead2
--- /dev/null
+++ b/man/play.Rd
@@ -0,0 +1,16 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/play.r
+\name{play}
+\alias{play}
+\title{Play the recorded lazy operations}
+\usage{
+play(dataframe, recordings)
+}
+\arguments{
+\item{dataframe}{A data.frame}
+
+\item{recordings}{A recording the expression, globals and packages using create_chunk_mapper}
+}
+\description{
+Play the recorded lazy operations
+}
diff --git a/man/srckeep.Rd b/man/srckeep.Rd
index c377c1c1..e4c4accc 100644
--- a/man/srckeep.Rd
+++ b/man/srckeep.Rd
@@ -2,12 +2,9 @@
 % Please edit documentation in R/srckeep.disk.frame.r
 \name{srckeep}
 \alias{srckeep}
-\alias{srckeepchunks}
 \title{Keep only the variables from the input listed in selections}
 \usage{
 srckeep(diskf, selections, ...)
-
-srckeepchunks(diskf, chunks, ...)
 }
 \arguments{
 \item{diskf}{a disk.frame}
@@ -15,8 +12,6 @@ srckeepchunks(diskf, chunks, ...)
 \item{selections}{The list of variables to keep from the input source}
 
 \item{...}{not yet used}
-
-\item{chunks}{The chunks to load}
 }
 \description{
 Keep only the variables from the input listed in selections
diff --git a/misc/disk.frame-report.html b/misc/disk.frame-report.html
index 12c97232..5f8a1d71 100644
--- a/misc/disk.frame-report.html
+++ b/misc/disk.frame-report.html
@@ -1,6 +1,6 @@
 <!DOCTYPE html>
-<!-- saved from url=(0053)http://localhost:30303/session/disk.frame-report.html -->
-<html class="gr__localhost"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
+<!-- saved from url=(0053)http://localhost:26081/session/disk.frame-report.html -->
+<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
 
 <style>body{background-color:white;}</style>
 <script src="./disk.frame-report_files/htmlwidgets.js.download"></script>
@@ -22,7 +22,7 @@
 <script src="./disk.frame-report_files/respond.min.js.download"></script>
 
 </head>
-<body data-gr-c-s-loaded="true" data-feedly-mini="yes">
+<body data-gr-c-s-loaded="true">
 <div class="container-fluid">
   <style type="text/css">table tr:hover td {
   font-weight:bold;text-decoration:none
@@ -94,26 +94,26 @@
   font-size: 11px;
 }</style>
   <div class="col-md-8 col-md-offset-2">
-    <h2>disk.frame coverage - 51.96%</h2>
+    <h2>disk.frame coverage - 52.99%</h2>
     <div class="tabbable">
       <ul class="nav nav-tabs" data-tabsetid="covr">
         <li class="active">
-          <a href="http://localhost:30303/session/disk.frame-report.html#tab-covr-1" data-toggle="tab" data-value="Files">Files</a>
+          <a href="http://localhost:26081/session/disk.frame-report.html#tab-covr-1" data-toggle="tab" data-value="Files">Files</a>
         </li>
         <li>
-          <a href="http://localhost:30303/session/disk.frame-report.html#tab-covr-2" data-toggle="tab" data-value="Source">Source</a>
+          <a href="http://localhost:26081/session/disk.frame-report.html#tab-covr-2" data-toggle="tab" data-value="Source">Source</a>
         </li>
       </ul>
       <div class="tab-content" data-tabsetid="covr">
         <div class="tab-pane active" title="Files" data-value="Files" id="tab-covr-1">
-          <div id="htmlwidget-5683a0a58516bd01df46" style="width:100%;height:500px;" class="datatables html-widget html-widget-static-bound"><div id="DataTables_Table_0_wrapper" class="dataTables_wrapper no-footer"><div class="dataTables_scroll"><div class="dataTables_scrollHead" style="overflow: hidden; position: relative; border: 0px; width: 100%;"><div class="dataTables_scrollHeadInner" style="box-sizing: content-box; width: 786px; padding-right: 17px;"><table class="row-border fill-container dataTable no-footer" role="grid" style="margin-left: 0px; width: 786px;"><thead>
-    <tr role="row"><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="File: activate to sort column ascending" style="width: 171px;">File</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Lines: activate to sort column ascending" style="width: 41px;">Lines</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Relevant: activate to sort column ascending" style="width: 64px;">Relevant</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Covered: activate to sort column ascending" style="width: 62px;">Covered</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Missed: activate to sort column ascending" style="width: 53px;">Missed</th><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Hits / Line: activate to sort column ascending" style="width: 73px;">Hits / Line</th><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Coverage: activate to sort column ascending" style="width: 71px;">Coverage</th></tr>
-  </thead></table></div></div><div class="dataTables_scrollBody" style="position: relative; overflow: auto; width: 100%; height: 459px;"><table class="row-border fill-container dataTable no-footer" id="DataTables_Table_0" role="grid"><thead>
-    <tr role="row" style="height: 0px;"><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="File: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 171px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">File</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Lines: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 41px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Lines</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Relevant: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 64px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Relevant</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Covered: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 62px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Covered</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Missed: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 53px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Missed</div></th><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Hits / Line: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 73px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Hits / Line</div></th><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Coverage: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 71px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Coverage</div></th></tr>
+          <div id="htmlwidget-286102d33ad14879488c" style="width:100%;height:500px;" class="datatables html-widget html-widget-static-bound"><div id="DataTables_Table_0_wrapper" class="dataTables_wrapper no-footer"><div class="dataTables_scroll"><div class="dataTables_scrollHead" style="overflow: hidden; position: relative; border: 0px; width: 100%;"><div class="dataTables_scrollHeadInner" style="box-sizing: content-box; width: 744px; padding-right: 14px;"><table class="row-border fill-container dataTable no-footer" role="grid" style="margin-left: 0px; width: 744px;"><thead>
+    <tr role="row"><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="File: activate to sort column ascending" style="width: 199px;">File</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Lines: activate to sort column ascending" style="width: 37px;">Lines</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Relevant: activate to sort column ascending" style="width: 58px;">Relevant</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Covered: activate to sort column ascending" style="width: 56px;">Covered</th><th class="dt-right sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Missed: activate to sort column ascending" style="width: 48px;">Missed</th><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Hits / Line: activate to sort column ascending" style="width: 29px;">Hits / Line</th><th class="sorting" tabindex="0" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Coverage: activate to sort column ascending" style="width: 64px;">Coverage</th></tr>
+  </thead></table></div></div><div class="dataTables_scrollBody" style="position: relative; overflow: auto; width: 100%; height: 420px;"><table class="row-border fill-container dataTable no-footer" id="DataTables_Table_0" role="grid"><thead>
+    <tr role="row" style="height: 0px;"><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="File: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 199px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">File</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Lines: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 37px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Lines</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Relevant: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 58px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Relevant</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Covered: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 56px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Covered</div></th><th class="dt-right sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Missed: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 48px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Missed</div></th><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Hits / Line: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 29px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Hits / Line</div></th><th class="sorting" aria-controls="DataTables_Table_0" rowspan="1" colspan="1" aria-label="Coverage: activate to sort column ascending" style="padding-top: 0px; padding-bottom: 0px; border-top-width: 0px; border-bottom-width: 0px; height: 0px; width: 64px;"><div class="dataTables_sizing" style="height: 0px; overflow: hidden;">Coverage</div></th></tr>
   </thead>
   
-<tbody><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/zip_to_disk.frame.r</a></td><td class=" dt-right">115</td><td class=" dt-right">45</td><td class=" dt-right">0</td><td class=" dt-right">45</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/sas2disk_frame.r</a></td><td class=" dt-right">77</td><td class=" dt-right">40</td><td class=" dt-right">0</td><td class=" dt-right">40</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/foverlaps.disk.frame.r</a></td><td class=" dt-right">100</td><td class=" dt-right">36</td><td class=" dt-right">0</td><td class=" dt-right">36</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/csv2disk.frame_readr.r</a></td><td class=" dt-right">51</td><td class=" dt-right">29</td><td class=" dt-right">0</td><td class=" dt-right">29</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/move_to.r</a></td><td class=" dt-right">66</td><td class=" dt-right">22</td><td class=" dt-right">0</td><td class=" dt-right">22</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/make_glm_streaming_fn.r</a></td><td class=" dt-right">47</td><td class=" dt-right">16</td><td class=" dt-right">0</td><td class=" dt-right">16</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/glm.r</a></td><td class=" dt-right">51</td><td class=" dt-right">12</td><td class=" dt-right">0</td><td class=" dt-right">12</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/print.disk.frame.r</a></td><td class=" dt-right">19</td><td class=" dt-right">8</td><td class=" dt-right">0</td><td class=" dt-right">8</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/show_ceremony.R</a></td><td class=" dt-right">31</td><td class=" dt-right">7</td><td class=" dt-right">0</td><td class=" dt-right">7</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/csv2disk.frame.r</a></td><td class=" dt-right">459</td><td class=" dt-right">258</td><td class=" dt-right">29</td><td class=" dt-right">229</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 11.24%, white 11.24%);">11.24%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/setup.r</a></td><td class=" dt-right">85</td><td class=" dt-right">22</td><td class=" dt-right">3</td><td class=" dt-right">19</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 13.64%, white 13.64%);">13.64%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/sample_n.R</a></td><td class=" dt-right">9</td><td class=" dt-right">3</td><td class=" dt-right">1</td><td class=" dt-right">2</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 33.33%, white 33.33%);">33.33%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/disk.frame.r</a></td><td class=" dt-right">240</td><td class=" dt-right">96</td><td class=" dt-right">33</td><td class=" dt-right">63</td><td>157</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 34.38%, white 34.38%);">34.38%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/recommend_nchunks.r</a></td><td class=" dt-right">109</td><td class=" dt-right">46</td><td class=" dt-right">16</td><td class=" dt-right">30</td><td>10</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 34.78%, white 34.78%);">34.78%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/hard_group_by.r</a></td><td class=" dt-right">221</td><td class=" dt-right">81</td><td class=" dt-right">45</td><td class=" dt-right">36</td><td>21</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 55.56%, white 55.56%);">55.56%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/write_disk.frame.r</a></td><td class=" dt-right">91</td><td class=" dt-right">32</td><td class=" dt-right">19</td><td class=" dt-right">13</td><td>399</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 59.38%, white 59.38%);">59.38%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/remove_chunk.r</a></td><td class=" dt-right">44</td><td class=" dt-right">11</td><td class=" dt-right">7</td><td class=" dt-right">4</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 63.64%, white 63.64%);">63.64%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/get_chunk.r</a></td><td class=" dt-right">82</td><td class=" dt-right">33</td><td class=" dt-right">22</td><td class=" dt-right">11</td><td>565</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 66.67%, white 66.67%);">66.67%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/rechunk.r</a></td><td class=" dt-right">155</td><td class=" dt-right">75</td><td class=" dt-right">53</td><td class=" dt-right">22</td><td>5</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 70.67%, white 70.67%);">70.67%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/overwrite_check.r</a></td><td class=" dt-right">43</td><td class=" dt-right">16</td><td class=" dt-right">12</td><td class=" dt-right">4</td><td>244</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 75%, white 75%);">75.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/shardkey.r</a></td><td class=" dt-right">26</td><td class=" dt-right">8</td><td class=" dt-right">6</td><td class=" dt-right">2</td><td>167</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 75%, white 75%);">75.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/map.r</a></td><td class=" dt-right">282</td><td class=" dt-right">80</td><td class=" dt-right">61</td><td class=" dt-right">19</td><td>51</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 76.25%, white 76.25%);">76.25%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/collect.r</a></td><td class=" dt-right">81</td><td class=" dt-right">17</td><td class=" dt-right">13</td><td class=" dt-right">4</td><td>20</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 76.47%, white 76.47%);">76.47%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/rbindlist.disk.frame.r</a></td><td class=" dt-right">77</td><td class=" dt-right">31</td><td class=" dt-right">24</td><td class=" dt-right">7</td><td>70</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 77.42%, white 77.42%);">77.42%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/sample_frac.R</a></td><td class=" dt-right">27</td><td class=" dt-right">9</td><td class=" dt-right">7</td><td class=" dt-right">2</td><td>1</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 77.78%, white 77.78%);">77.78%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/add_chunk.r</a></td><td class=" dt-right">147</td><td class=" dt-right">62</td><td class=" dt-right">50</td><td class=" dt-right">12</td><td>18</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 80.65%, white 80.65%);">80.65%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/dplyr_verbs.r</a></td><td class=" dt-right">454</td><td class=" dt-right">42</td><td class=" dt-right">34</td><td class=" dt-right">8</td><td>258</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 80.95%, white 80.95%);">80.95%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/ncol-nrow.r</a></td><td class=" dt-right">66</td><td class=" dt-right">16</td><td class=" dt-right">13</td><td class=" dt-right">3</td><td>80</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 81.25%, white 81.25%);">81.25%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/semi_join.r</a></td><td class=" dt-right">55</td><td class=" dt-right">29</td><td class=" dt-right">24</td><td class=" dt-right">5</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.76%, white 82.76%);">82.76%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/full_join.r</a></td><td class=" dt-right">53</td><td class=" dt-right">29</td><td class=" dt-right">24</td><td class=" dt-right">5</td><td>10</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.76%, white 82.76%);">82.76%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/anti_join.r</a></td><td class=" dt-right">69</td><td class=" dt-right">29</td><td class=" dt-right">24</td><td class=" dt-right">5</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.76%, white 82.76%);">82.76%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/inner_join.r</a></td><td class=" dt-right">66</td><td class=" dt-right">36</td><td class=" dt-right">30</td><td class=" dt-right">6</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 83.33%, white 83.33%);">83.33%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/left_join.r</a></td><td class=" dt-right">58</td><td class=" dt-right">31</td><td class=" dt-right">26</td><td class=" dt-right">5</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 83.87%, white 83.87%);">83.87%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/nchunks.r</a></td><td class=" dt-right">43</td><td class=" dt-right">7</td><td class=" dt-right">6</td><td class=" dt-right">1</td><td>320</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 85.71%, white 85.71%);">85.71%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/is_disk.frame.r</a></td><td class=" dt-right">40</td><td class=" dt-right">15</td><td class=" dt-right">13</td><td class=" dt-right">2</td><td>317</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 86.67%, white 86.67%);">86.67%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/names.r</a></td><td class=" dt-right">39</td><td class=" dt-right">8</td><td class=" dt-right">7</td><td class=" dt-right">1</td><td>21</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 87.5%, white 87.5%);">87.50%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/map2.r</a></td><td class=" dt-right">94</td><td class=" dt-right">32</td><td class=" dt-right">29</td><td class=" dt-right">3</td><td>35</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 90.62%, white 90.62%);">90.62%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/get_chunk_ids.r</a></td><td class=" dt-right">38</td><td class=" dt-right">11</td><td class=" dt-right">10</td><td class=" dt-right">1</td><td>211</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 90.91%, white 90.91%);">90.91%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/util.r</a></td><td class=" dt-right">27</td><td class=" dt-right">12</td><td class=" dt-right">11</td><td class=" dt-right">1</td><td>17</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 91.67%, white 91.67%);">91.67%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/hard_arrange.r</a></td><td class=" dt-right">67</td><td class=" dt-right">14</td><td class=" dt-right">13</td><td class=" dt-right">1</td><td>6</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 92.86%, white 92.86%);">92.86%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/shard.r</a></td><td class=" dt-right">69</td><td class=" dt-right">29</td><td class=" dt-right">27</td><td class=" dt-right">2</td><td>135</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 93.1%, white 93.1%);">93.10%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/data.table.r</a></td><td class=" dt-right">67</td><td class=" dt-right">17</td><td class=" dt-right">16</td><td class=" dt-right">1</td><td>11</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 94.12%, white 94.12%);">94.12%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/merge.disk.frame.r</a></td><td class=" dt-right">98</td><td class=" dt-right">30</td><td class=" dt-right">30</td><td class=" dt-right">0</td><td>2</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/sortablestr2i.R</a></td><td class=" dt-right">67</td><td class=" dt-right">22</td><td class=" dt-right">22</td><td class=" dt-right">0</td><td>49</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/zzz.r</a></td><td class=" dt-right">59</td><td class=" dt-right">12</td><td class=" dt-right">12</td><td class=" dt-right">0</td><td>12</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/as.disk.frame.r</a></td><td class=" dt-right">42</td><td class=" dt-right">9</td><td class=" dt-right">9</td><td class=" dt-right">0</td><td>65</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/srckeep.disk.frame.r</a></td><td class=" dt-right">17</td><td class=" dt-right">3</td><td class=" dt-right">3</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/compute.r</a></td><td class=" dt-right">23</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>3</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/as.data.frame.r</a></td><td class=" dt-right">31</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/delete.r</a></td><td class=" dt-right">12</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>8</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:30303/session/disk.frame-report.html#">R/tbl_vars.r</a></td><td class=" dt-right">10</td><td class=" dt-right">1</td><td class=" dt-right">1</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr></tbody></table></div></div></div></div>
-          <script type="application/json" data-for="htmlwidget-5683a0a58516bd01df46">{"x":{"filter":"none","fillContainer":true,"data":[["<a href=\"#\">R/zip_to_disk.frame.r<\/a>","<a href=\"#\">R/sas2disk_frame.r<\/a>","<a href=\"#\">R/foverlaps.disk.frame.r<\/a>","<a href=\"#\">R/csv2disk.frame_readr.r<\/a>","<a href=\"#\">R/move_to.r<\/a>","<a href=\"#\">R/make_glm_streaming_fn.r<\/a>","<a href=\"#\">R/glm.r<\/a>","<a href=\"#\">R/print.disk.frame.r<\/a>","<a href=\"#\">R/show_ceremony.R<\/a>","<a href=\"#\">R/csv2disk.frame.r<\/a>","<a href=\"#\">R/setup.r<\/a>","<a href=\"#\">R/sample_n.R<\/a>","<a href=\"#\">R/disk.frame.r<\/a>","<a href=\"#\">R/recommend_nchunks.r<\/a>","<a href=\"#\">R/hard_group_by.r<\/a>","<a href=\"#\">R/write_disk.frame.r<\/a>","<a href=\"#\">R/remove_chunk.r<\/a>","<a href=\"#\">R/get_chunk.r<\/a>","<a href=\"#\">R/rechunk.r<\/a>","<a href=\"#\">R/overwrite_check.r<\/a>","<a href=\"#\">R/shardkey.r<\/a>","<a href=\"#\">R/map.r<\/a>","<a href=\"#\">R/collect.r<\/a>","<a href=\"#\">R/rbindlist.disk.frame.r<\/a>","<a href=\"#\">R/sample_frac.R<\/a>","<a href=\"#\">R/add_chunk.r<\/a>","<a href=\"#\">R/dplyr_verbs.r<\/a>","<a href=\"#\">R/ncol-nrow.r<\/a>","<a href=\"#\">R/semi_join.r<\/a>","<a href=\"#\">R/full_join.r<\/a>","<a href=\"#\">R/anti_join.r<\/a>","<a href=\"#\">R/inner_join.r<\/a>","<a href=\"#\">R/left_join.r<\/a>","<a href=\"#\">R/nchunks.r<\/a>","<a href=\"#\">R/is_disk.frame.r<\/a>","<a href=\"#\">R/names.r<\/a>","<a href=\"#\">R/map2.r<\/a>","<a href=\"#\">R/get_chunk_ids.r<\/a>","<a href=\"#\">R/util.r<\/a>","<a href=\"#\">R/hard_arrange.r<\/a>","<a href=\"#\">R/shard.r<\/a>","<a href=\"#\">R/data.table.r<\/a>","<a href=\"#\">R/merge.disk.frame.r<\/a>","<a href=\"#\">R/sortablestr2i.R<\/a>","<a href=\"#\">R/zzz.r<\/a>","<a href=\"#\">R/as.disk.frame.r<\/a>","<a href=\"#\">R/srckeep.disk.frame.r<\/a>","<a href=\"#\">R/compute.r<\/a>","<a href=\"#\">R/as.data.frame.r<\/a>","<a href=\"#\">R/delete.r<\/a>","<a href=\"#\">R/tbl_vars.r<\/a>"],[115,77,100,51,66,47,51,19,31,459,85,9,240,109,221,91,44,82,155,43,26,282,81,77,27,147,454,66,55,53,69,66,58,43,40,39,94,38,27,67,69,67,98,67,59,42,17,23,31,12,10],[45,40,36,29,22,16,12,8,7,258,22,3,96,46,81,32,11,33,75,16,8,80,17,31,9,62,42,16,29,29,29,36,31,7,15,8,32,11,12,14,29,17,30,22,12,9,3,2,2,2,1],[0,0,0,0,0,0,0,0,0,29,3,1,33,16,45,19,7,22,53,12,6,61,13,24,7,50,34,13,24,24,24,30,26,6,13,7,29,10,11,13,27,16,30,22,12,9,3,2,2,2,1],[45,40,36,29,22,16,12,8,7,229,19,2,63,30,36,13,4,11,22,4,2,19,4,7,2,12,8,3,5,5,5,6,5,1,2,1,3,1,1,1,2,1,0,0,0,0,0,0,0,0,0],["0","0","0","0","0","0","0","0","0","1","1","0","157","10","21","399","1","565","5","244","167","51","20","70","1","18","258","80","8","10","8","8","8","320","317","21","35","211","17","6","135","11","2","49","12","65","1","3","1","8","1"],["0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","11.24%","13.64%","33.33%","34.38%","34.78%","55.56%","59.38%","63.64%","66.67%","70.67%","75.00%","75.00%","76.25%","76.47%","77.42%","77.78%","80.65%","80.95%","81.25%","82.76%","82.76%","82.76%","83.33%","83.87%","85.71%","86.67%","87.50%","90.62%","90.91%","91.67%","92.86%","93.10%","94.12%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%"]],"container":"<table class=\"row-border fill-container\">\n  <thead>\n    <tr>\n      <th>File<\/th>\n      <th>Lines<\/th>\n      <th>Relevant<\/th>\n      <th>Covered<\/th>\n      <th>Missed<\/th>\n      <th>Hits / Line<\/th>\n      <th>Coverage<\/th>\n    <\/tr>\n  <\/thead>\n<\/table>","options":{"searching":false,"dom":"t","paging":false,"columnDefs":[{"targets":6,"createdCell":"function(td, cellData, rowData, row, col) {\n  var percent = cellData.replace(\"%\", \"\");\n  if (percent > 90) {\n    var grad = \"linear-gradient(90deg, #edfde7 \" + cellData + \", white \" + cellData + \")\";\n  } else if (percent > 75) {\n    var grad = \"linear-gradient(90deg, #f9ffe5 \" + cellData + \", white \" + cellData + \")\";\n  } else {\n    var grad = \"linear-gradient(90deg, #fcece9 \" + cellData + \", white \" + cellData + \")\";\n  }\n  $(td).css(\"background\", grad);\n}\n"},{"className":"dt-right","targets":[1,2,3,4]}],"order":[],"autoWidth":false,"orderClasses":false},"callback":"function(table) {\ntable.on('click.dt', 'a', function() {\n  files = $('div#files div');\n  files.not('div.hidden').addClass('hidden');\n  id = $(this).text();\n  files.filter('div[id=\\'' + id + '\\']').removeClass('hidden');\n  $('ul.nav a[data-value=Source]').text(id).tab('show');\n});\n}"},"evals":["options.columnDefs.0.createdCell","callback"],"jsHooks":[]}</script>
+<tbody><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/zip_to_disk.frame.r</a></td><td class=" dt-right">115</td><td class=" dt-right">45</td><td class=" dt-right">0</td><td class=" dt-right">45</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/sas2disk_frame.r</a></td><td class=" dt-right">77</td><td class=" dt-right">40</td><td class=" dt-right">0</td><td class=" dt-right">40</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/foverlaps.disk.frame.r</a></td><td class=" dt-right">89</td><td class=" dt-right">35</td><td class=" dt-right">0</td><td class=" dt-right">35</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/csv2disk.frame_readr.r</a></td><td class=" dt-right">51</td><td class=" dt-right">29</td><td class=" dt-right">0</td><td class=" dt-right">29</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/move_to.r</a></td><td class=" dt-right">66</td><td class=" dt-right">22</td><td class=" dt-right">0</td><td class=" dt-right">22</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/show_ceremony.R</a></td><td class=" dt-right">31</td><td class=" dt-right">7</td><td class=" dt-right">0</td><td class=" dt-right">7</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/collect.summarized_disk.frame.r</a></td><td class=" dt-right">31</td><td class=" dt-right">3</td><td class=" dt-right">0</td><td class=" dt-right">3</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/map_by_chunk_id.r</a></td><td class=" dt-right">6</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td class=" dt-right">2</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 0%, white 0%);">0.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/csv2disk.frame.r</a></td><td class=" dt-right">468</td><td class=" dt-right">268</td><td class=" dt-right">29</td><td class=" dt-right">239</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 10.82%, white 10.82%);">10.82%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/map-deprecated.r</a></td><td class=" dt-right">85</td><td class=" dt-right">16</td><td class=" dt-right">2</td><td class=" dt-right">14</td><td>10</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 12.5%, white 12.5%);">12.50%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/setup.r</a></td><td class=" dt-right">85</td><td class=" dt-right">22</td><td class=" dt-right">3</td><td class=" dt-right">19</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 13.64%, white 13.64%);">13.64%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/sample_n.R</a></td><td class=" dt-right">9</td><td class=" dt-right">3</td><td class=" dt-right">1</td><td class=" dt-right">2</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 33.33%, white 33.33%);">33.33%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/disk.frame.r</a></td><td class=" dt-right">240</td><td class=" dt-right">96</td><td class=" dt-right">33</td><td class=" dt-right">63</td><td>151</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 34.38%, white 34.38%);">34.38%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/hard_group_by.r</a></td><td class=" dt-right">220</td><td class=" dt-right">81</td><td class=" dt-right">31</td><td class=" dt-right">50</td><td>19</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 38.27%, white 38.27%);">38.27%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/recommend_nchunks.r</a></td><td class=" dt-right">136</td><td class=" dt-right">63</td><td class=" dt-right">26</td><td class=" dt-right">37</td><td>14</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 41.27%, white 41.27%);">41.27%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/srckeep.disk.frame.r</a></td><td class=" dt-right">31</td><td class=" dt-right">7</td><td class=" dt-right">3</td><td class=" dt-right">4</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 42.86%, white 42.86%);">42.86%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/one-stage-verbs.R</a></td><td class=" dt-right">390</td><td class=" dt-right">110</td><td class=" dt-right">53</td><td class=" dt-right">57</td><td>0</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 48.18%, white 48.18%);">48.18%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/glm.r</a></td><td class=" dt-right">68</td><td class=" dt-right">21</td><td class=" dt-right">12</td><td class=" dt-right">9</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 57.14%, white 57.14%);">57.14%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/write_disk.frame.r</a></td><td class=" dt-right">91</td><td class=" dt-right">32</td><td class=" dt-right">19</td><td class=" dt-right">13</td><td>378</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 59.38%, white 59.38%);">59.38%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/remove_chunk.r</a></td><td class=" dt-right">44</td><td class=" dt-right">11</td><td class=" dt-right">7</td><td class=" dt-right">4</td><td>1</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 63.64%, white 63.64%);">63.64%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/get_chunk.r</a></td><td class=" dt-right">102</td><td class=" dt-right">34</td><td class=" dt-right">23</td><td class=" dt-right">11</td><td>560</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 67.65%, white 67.65%);">67.65%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/rechunk.r</a></td><td class=" dt-right">155</td><td class=" dt-right">75</td><td class=" dt-right">53</td><td class=" dt-right">22</td><td>5</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 70.67%, white 70.67%);">70.67%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/dplyr_verbs.r</a></td><td class=" dt-right">322</td><td class=" dt-right">22</td><td class=" dt-right">16</td><td class=" dt-right">6</td><td>291</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 72.73%, white 72.73%);">72.73%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/overwrite_check.r</a></td><td class=" dt-right">43</td><td class=" dt-right">16</td><td class=" dt-right">12</td><td class=" dt-right">4</td><td>233</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 75%, white 75%);">75.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/shardkey.r</a></td><td class=" dt-right">26</td><td class=" dt-right">8</td><td class=" dt-right">6</td><td class=" dt-right">2</td><td>161</td><td style="background: linear-gradient(90deg, rgb(252, 236, 233) 75%, white 75%);">75.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/collect.r</a></td><td class=" dt-right">75</td><td class=" dt-right">17</td><td class=" dt-right">13</td><td class=" dt-right">4</td><td>19</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 76.47%, white 76.47%);">76.47%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/sample_frac.R</a></td><td class=" dt-right">27</td><td class=" dt-right">9</td><td class=" dt-right">7</td><td class=" dt-right">2</td><td>1</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 77.78%, white 77.78%);">77.78%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/rbindlist.disk.frame.r</a></td><td class=" dt-right">80</td><td class=" dt-right">33</td><td class=" dt-right">26</td><td class=" dt-right">7</td><td>71</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 78.79%, white 78.79%);">78.79%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/cmap.r</a></td><td class=" dt-right">241</td><td class=" dt-right">76</td><td class=" dt-right">61</td><td class=" dt-right">15</td><td>51</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 80.26%, white 80.26%);">80.26%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/add_chunk.r</a></td><td class=" dt-right">147</td><td class=" dt-right">62</td><td class=" dt-right">50</td><td class=" dt-right">12</td><td>18</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 80.65%, white 80.65%);">80.65%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/ncol-nrow.r</a></td><td class=" dt-right">66</td><td class=" dt-right">16</td><td class=" dt-right">13</td><td class=" dt-right">3</td><td>75</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 81.25%, white 81.25%);">81.25%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/data.table.r</a></td><td class=" dt-right">68</td><td class=" dt-right">17</td><td class=" dt-right">14</td><td class=" dt-right">3</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.35%, white 82.35%);">82.35%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/full_join.r</a></td><td class=" dt-right">53</td><td class=" dt-right">29</td><td class=" dt-right">24</td><td class=" dt-right">5</td><td>10</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.76%, white 82.76%);">82.76%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/map2.r</a></td><td class=" dt-right">106</td><td class=" dt-right">35</td><td class=" dt-right">29</td><td class=" dt-right">6</td><td>32</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 82.86%, white 82.86%);">82.86%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/semi_join.r</a></td><td class=" dt-right">55</td><td class=" dt-right">30</td><td class=" dt-right">25</td><td class=" dt-right">5</td><td>7</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 83.33%, white 83.33%);">83.33%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/anti_join.r</a></td><td class=" dt-right">70</td><td class=" dt-right">30</td><td class=" dt-right">25</td><td class=" dt-right">5</td><td>7</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 83.33%, white 83.33%);">83.33%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/inner_join.r</a></td><td class=" dt-right">66</td><td class=" dt-right">37</td><td class=" dt-right">31</td><td class=" dt-right">6</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 83.78%, white 83.78%);">83.78%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/left_join.r</a></td><td class=" dt-right">58</td><td class=" dt-right">32</td><td class=" dt-right">27</td><td class=" dt-right">5</td><td>8</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 84.38%, white 84.38%);">84.38%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/chunk_mapper.r</a></td><td class=" dt-right">89</td><td class=" dt-right">27</td><td class=" dt-right">23</td><td class=" dt-right">4</td><td>142</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 85.19%, white 85.19%);">85.19%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/nchunks.r</a></td><td class=" dt-right">43</td><td class=" dt-right">7</td><td class=" dt-right">6</td><td class=" dt-right">1</td><td>308</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 85.71%, white 85.71%);">85.71%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/is_disk.frame.r</a></td><td class=" dt-right">40</td><td class=" dt-right">15</td><td class=" dt-right">13</td><td class=" dt-right">2</td><td>304</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 86.67%, white 86.67%);">86.67%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/make_glm_streaming_fn.r</a></td><td class=" dt-right">54</td><td class=" dt-right">16</td><td class=" dt-right">14</td><td class=" dt-right">2</td><td>12</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 87.5%, white 87.5%);">87.50%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/names.r</a></td><td class=" dt-right">39</td><td class=" dt-right">8</td><td class=" dt-right">7</td><td class=" dt-right">1</td><td>20</td><td style="background: linear-gradient(90deg, rgb(249, 255, 229) 87.5%, white 87.5%);">87.50%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/get_chunk_ids.r</a></td><td class=" dt-right">38</td><td class=" dt-right">11</td><td class=" dt-right">10</td><td class=" dt-right">1</td><td>210</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 90.91%, white 90.91%);">90.91%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/hard_arrange.r</a></td><td class=" dt-right">67</td><td class=" dt-right">14</td><td class=" dt-right">13</td><td class=" dt-right">1</td><td>6</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 92.86%, white 92.86%);">92.86%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/shard.r</a></td><td class=" dt-right">69</td><td class=" dt-right">29</td><td class=" dt-right">27</td><td class=" dt-right">2</td><td>128</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 93.1%, white 93.1%);">93.10%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/merge.disk.frame.r</a></td><td class=" dt-right">98</td><td class=" dt-right">30</td><td class=" dt-right">30</td><td class=" dt-right">0</td><td>2</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/sortablestr2i.R</a></td><td class=" dt-right">67</td><td class=" dt-right">22</td><td class=" dt-right">22</td><td class=" dt-right">0</td><td>38</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/zzz.r</a></td><td class=" dt-right">66</td><td class=" dt-right">12</td><td class=" dt-right">12</td><td class=" dt-right">0</td><td>16</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/util.r</a></td><td class=" dt-right">27</td><td class=" dt-right">12</td><td class=" dt-right">12</td><td class=" dt-right">0</td><td>14</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/as.disk.frame.r</a></td><td class=" dt-right">42</td><td class=" dt-right">9</td><td class=" dt-right">9</td><td class=" dt-right">0</td><td>63</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/print.disk.frame.r</a></td><td class=" dt-right">19</td><td class=" dt-right">8</td><td class=" dt-right">8</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/as.data.frame.r</a></td><td class=" dt-right">31</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/compute.r</a></td><td class=" dt-right">23</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>3</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="odd"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/delete.r</a></td><td class=" dt-right">12</td><td class=" dt-right">2</td><td class=" dt-right">2</td><td class=" dt-right">0</td><td>8</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr><tr role="row" class="even"><td><a href="http://localhost:26081/session/disk.frame-report.html#">R/tbl_vars.r</a></td><td class=" dt-right">10</td><td class=" dt-right">1</td><td class=" dt-right">1</td><td class=" dt-right">0</td><td>1</td><td style="background: linear-gradient(90deg, rgb(237, 253, 231) 100%, white 100%);">100.00%</td></tr></tbody></table></div></div></div></div>
+          <script type="application/json" data-for="htmlwidget-286102d33ad14879488c">{"x":{"filter":"none","fillContainer":true,"data":[["<a href=\"#\">R/zip_to_disk.frame.r<\/a>","<a href=\"#\">R/sas2disk_frame.r<\/a>","<a href=\"#\">R/foverlaps.disk.frame.r<\/a>","<a href=\"#\">R/csv2disk.frame_readr.r<\/a>","<a href=\"#\">R/move_to.r<\/a>","<a href=\"#\">R/show_ceremony.R<\/a>","<a href=\"#\">R/collect.summarized_disk.frame.r<\/a>","<a href=\"#\">R/map_by_chunk_id.r<\/a>","<a href=\"#\">R/csv2disk.frame.r<\/a>","<a href=\"#\">R/map-deprecated.r<\/a>","<a href=\"#\">R/setup.r<\/a>","<a href=\"#\">R/sample_n.R<\/a>","<a href=\"#\">R/disk.frame.r<\/a>","<a href=\"#\">R/hard_group_by.r<\/a>","<a href=\"#\">R/recommend_nchunks.r<\/a>","<a href=\"#\">R/srckeep.disk.frame.r<\/a>","<a href=\"#\">R/one-stage-verbs.R<\/a>","<a href=\"#\">R/glm.r<\/a>","<a href=\"#\">R/write_disk.frame.r<\/a>","<a href=\"#\">R/remove_chunk.r<\/a>","<a href=\"#\">R/get_chunk.r<\/a>","<a href=\"#\">R/rechunk.r<\/a>","<a href=\"#\">R/dplyr_verbs.r<\/a>","<a href=\"#\">R/overwrite_check.r<\/a>","<a href=\"#\">R/shardkey.r<\/a>","<a href=\"#\">R/collect.r<\/a>","<a href=\"#\">R/sample_frac.R<\/a>","<a href=\"#\">R/rbindlist.disk.frame.r<\/a>","<a href=\"#\">R/cmap.r<\/a>","<a href=\"#\">R/add_chunk.r<\/a>","<a href=\"#\">R/ncol-nrow.r<\/a>","<a href=\"#\">R/data.table.r<\/a>","<a href=\"#\">R/full_join.r<\/a>","<a href=\"#\">R/map2.r<\/a>","<a href=\"#\">R/semi_join.r<\/a>","<a href=\"#\">R/anti_join.r<\/a>","<a href=\"#\">R/inner_join.r<\/a>","<a href=\"#\">R/left_join.r<\/a>","<a href=\"#\">R/chunk_mapper.r<\/a>","<a href=\"#\">R/nchunks.r<\/a>","<a href=\"#\">R/is_disk.frame.r<\/a>","<a href=\"#\">R/make_glm_streaming_fn.r<\/a>","<a href=\"#\">R/names.r<\/a>","<a href=\"#\">R/get_chunk_ids.r<\/a>","<a href=\"#\">R/hard_arrange.r<\/a>","<a href=\"#\">R/shard.r<\/a>","<a href=\"#\">R/merge.disk.frame.r<\/a>","<a href=\"#\">R/sortablestr2i.R<\/a>","<a href=\"#\">R/zzz.r<\/a>","<a href=\"#\">R/util.r<\/a>","<a href=\"#\">R/as.disk.frame.r<\/a>","<a href=\"#\">R/print.disk.frame.r<\/a>","<a href=\"#\">R/as.data.frame.r<\/a>","<a href=\"#\">R/compute.r<\/a>","<a href=\"#\">R/delete.r<\/a>","<a href=\"#\">R/tbl_vars.r<\/a>"],[115,77,89,51,66,31,31,6,468,85,85,9,240,220,136,31,390,68,91,44,102,155,322,43,26,75,27,80,241,147,66,68,53,106,55,70,66,58,89,43,40,54,39,38,67,69,98,67,66,27,42,19,31,23,12,10],[45,40,35,29,22,7,3,2,268,16,22,3,96,81,63,7,110,21,32,11,34,75,22,16,8,17,9,33,76,62,16,17,29,35,30,30,37,32,27,7,15,16,8,11,14,29,30,22,12,12,9,8,2,2,2,1],[0,0,0,0,0,0,0,0,29,2,3,1,33,31,26,3,53,12,19,7,23,53,16,12,6,13,7,26,61,50,13,14,24,29,25,25,31,27,23,6,13,14,7,10,13,27,30,22,12,12,9,8,2,2,2,1],[45,40,35,29,22,7,3,2,239,14,19,2,63,50,37,4,57,9,13,4,11,22,6,4,2,4,2,7,15,12,3,3,5,6,5,5,6,5,4,1,2,2,1,1,1,2,0,0,0,0,0,0,0,0,0,0],["0","0","0","0","0","0","0","0","1","10","1","0","151","19","14","0","0","1","378","1","560","5","291","233","161","19","1","71","51","18","75","8","10","32","7","7","8","8","142","308","304","12","20","210","6","128","2","38","16","14","63","1","1","3","8","1"],["0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","0.00%","10.82%","12.50%","13.64%","33.33%","34.38%","38.27%","41.27%","42.86%","48.18%","57.14%","59.38%","63.64%","67.65%","70.67%","72.73%","75.00%","75.00%","76.47%","77.78%","78.79%","80.26%","80.65%","81.25%","82.35%","82.76%","82.86%","83.33%","83.33%","83.78%","84.38%","85.19%","85.71%","86.67%","87.50%","87.50%","90.91%","92.86%","93.10%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%","100.00%"]],"container":"<table class=\"row-border fill-container\">\n  <thead>\n    <tr>\n      <th>File<\/th>\n      <th>Lines<\/th>\n      <th>Relevant<\/th>\n      <th>Covered<\/th>\n      <th>Missed<\/th>\n      <th>Hits / Line<\/th>\n      <th>Coverage<\/th>\n    <\/tr>\n  <\/thead>\n<\/table>","options":{"searching":false,"dom":"t","paging":false,"columnDefs":[{"targets":6,"createdCell":"function(td, cellData, rowData, row, col) {\n  var percent = cellData.replace(\"%\", \"\");\n  if (percent > 90) {\n    var grad = \"linear-gradient(90deg, #edfde7 \" + cellData + \", white \" + cellData + \")\";\n  } else if (percent > 75) {\n    var grad = \"linear-gradient(90deg, #f9ffe5 \" + cellData + \", white \" + cellData + \")\";\n  } else {\n    var grad = \"linear-gradient(90deg, #fcece9 \" + cellData + \", white \" + cellData + \")\";\n  }\n  $(td).css(\"background\", grad);\n}\n"},{"className":"dt-right","targets":[1,2,3,4]}],"order":[],"autoWidth":false,"orderClasses":false},"callback":"function(table) {\ntable.on('click.dt', 'a', function() {\n  files = $('div#files div');\n  files.not('div.hidden').addClass('hidden');\n  id = $(this).text();\n  files.filter('div[id=\\'' + id + '\\']').removeClass('hidden');\n  $('ul.nav a[data-value=Source]').text(id).tab('show');\n});\n}"},"evals":["options.columnDefs.0.createdCell","callback"],"jsHooks":[]}</script>
         </div>
         <div class="tab-pane" title="Source" data-value="Source" id="tab-covr-2">
           <div id="files">
@@ -227,7 +227,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">16</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"fst"</span><span class="paren">)</span></pre>
                     </td>
@@ -241,14 +241,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">18</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">dir.exists</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">19</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="identifier">disk.frame_folder</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
                     </td>
@@ -472,7 +472,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">51</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
@@ -486,7 +486,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">53</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
@@ -521,14 +521,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">58</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">59</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">json_path</span> <span class="operator">=</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="string">".metadata"</span>, <span class="string">"meta.json"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
@@ -542,21 +542,21 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">61</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">filesize</span> <span class="operator">=</span> <span class="identifier">file.size</span><span class="paren">(</span><span class="string">"meta.json"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">62</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">meta_out</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">63</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">filesize</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
@@ -570,49 +570,49 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">65</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="identifier">meta_out</span> <span class="operator">=</span> <span class="identifier">jsonlite</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">toJSON</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">66</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">        <span class="identifier">c</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">67</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">          <span class="identifier">list</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">68</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">            <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">69</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">            <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardkey</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">70</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">            <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">shardchunks</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">71</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">          <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
@@ -682,14 +682,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">81</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">cat</span><span class="paren">(</span><span class="identifier">meta_out</span>, <span class="identifier">file</span> <span class="operator">=</span> <span class="identifier">json_path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">82</td>
-                    <td class="coverage">377<em>x</em></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">df</span></pre>
                     </td>
@@ -738,42 +738,42 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">89</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">df</span> <span class="operator">&lt;-</span> <span class="identifier">list</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">90</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">df</span><span class="operator">$</span><span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">91</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">df</span><span class="operator">$</span><span class="identifier">files_short</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">92</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">path</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">93</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"backend"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="string">"fst"</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">94</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"disk.frame"</span>, <span class="string">"disk.frame.folder"</span><span class="paren">)</span></pre>
                     </td>
@@ -787,14 +787,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">96</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"performing"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="string">"none"</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">97</td>
-                    <td class="coverage">517<em>x</em></td>
+                    <td class="coverage">499<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">df</span></pre>
                     </td>
@@ -1039,7 +1039,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">132</td>
-                    <td class="coverage">104<em>x</em></td>
+                    <td class="coverage">103<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="keyword">return</span><span class="paren">(</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
@@ -1368,21 +1368,21 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">179</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">check.consistency</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">180</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="identifier">fpath</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">181</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">dir.exists</span><span class="paren">(</span><span class="identifier">fpath</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">fpath</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
@@ -1403,7 +1403,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">184</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
@@ -1466,7 +1466,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">193</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="operator">!</span><span class="identifier">is.file.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">check.consistency</span> <span class="operator">=</span> <span class="identifier">check.consistency</span><span class="paren">)</span></pre>
                     </td>
@@ -1803,467 +1803,600 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/inner_join.r" class="hidden">
+            <div id="R/setup.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' Set up disk.frame environment</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param workers the number of workers (background R processes in the</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param future_backend which future backend to use for parallelization</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param gui Whether to use a Graphical User Interface (GUI) for selecting the options. Defaults to FALSE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to `future::plan`</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' join.df = inner_join(cars.df, cars.df, merge_by_chunk_id = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future plan multiprocess nbrOfWorkers sequential</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' if (interactive()) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   # setup disk.frame to use multiple workers these may use more than two</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">inner_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_inner_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   # cores, and is therefore not allowed on CRAN. Hence it's set to run only in</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">12</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   # interactive session</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   setup_disk.frame()</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   # use a Shiny GUI to adjust settings</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   # only run in interactive()</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">17</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   setup_disk.frame(gui = TRUE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">18</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' }</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">19</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">20</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # set the number workers to 2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' setup_disk.frame(2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">22</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' # if you do not wish to use multiple workers you can set it to sequential</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' setup_disk.frame(future_backend=future::sequential)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="identifier">setup_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getDTthreads</span><span class="paren">(</span><span class="paren">)</span>, <span class="identifier">future_backend</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">multisession</span>, <span class="keyword">...</span>, <span class="identifier">gui</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">gui</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">27</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">plan</span><span class="paren">(</span><span class="identifier">future_backend</span>, <span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">workers</span>, <span class="identifier">gc</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"The number of workers available for disk.frame is %d"</span>, <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">29</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">inner_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># do not limit the amount of transfers to other workers</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">30</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># this is not allowed by CRAN policy</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#options(future.globals.maxSize = future.globals.maxSize)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">32</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#options(disk.frame.nworkers = workers)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">33</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">gui</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">34</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"shiny"</span>, <span class="identifier">quietly</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">35</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"Package \"shiny\" must be installed to use GUI. You can install shiny using install.packages('shiny')"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">36</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">           <span class="identifier">call</span>. <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">37</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">38</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">39</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">ui</span> <span class="operator">&lt;-</span> <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fluidPage</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">40</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">h1</span><span class="paren">(</span><span class="string">"disk.frame settings"</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">41</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sliderInput</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">42</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="string">"nbrOfWorkers"</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">43</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Number of workers (recommendation = %d)"</span>, <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="identifier">logical</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">44</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="number">1</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">45</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">46</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">inner_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">value</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">47</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">step</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">48</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dotdotdot</span> <span class="operator">&lt;-</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">includeMarkdown</span><span class="paren">(</span><span class="identifier">system.file</span><span class="paren">(</span><span class="string">"options.rmd"</span>, <span class="identifier">package</span><span class="operator">=</span><span class="string">"disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">      <span class="comment"># , shiny::checkboxInput(</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">50</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment">#   "inf_fgm", </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">51</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment">#   "Recommended: Set Maximum transfer size between workers to Inf (so ignore slider below)", </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">52</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#   value = ifelse(</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">53</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment">#     is.null(getOption("future.globals.maxSize")), </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">54</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#     TRUE, </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment">#     is.infinite(getOption("future.globals.maxSize")))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#inner_join(.x, .y, by = by, copy = copy, ..., overwrite = overwrite)</span></pre>
+                      <pre class="language-r">      <span class="comment"># )</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">57</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">lij</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">lift</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">inner_join</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment"># ,shiny::sliderInput(</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">58</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">lij</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">.x</span>, <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#   "future.globals.maxSize",</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">59</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#   "Maximum transfer size between workers (gb)",</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">60</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#   0,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment">#   ifelse(is.infinite(memory.limit()), 3904, memory.limit()/1024/1024/1024),</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
+                      <pre class="language-r">      <span class="comment">#   value = ifelse(is.infinite(getOption("future.globals.maxSize")), 3904, memory.limit()/1024/1024/1024),</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">63</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#   step = 0.5</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment"># )</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">66</td>
                     <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">67</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">server</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">input</span>, <span class="identifier">output</span>, <span class="identifier">session</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">68</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">observe</span><span class="paren">(</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">69</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">plan</span><span class="paren">(</span><span class="identifier">future_backend</span>, <span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">input</span><span class="operator">$</span><span class="identifier">nbrOfWorkers</span>, <span class="identifier">gc</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">70</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">71</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">72</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="comment">#shiny::observe({</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">73</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#if(input$inf_fgm) {</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">74</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="comment">#options(future.globals.maxSize = Inf)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">75</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#} else {</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">76</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="comment">#options(future.globals.maxSize = input$future.globals.maxSize*1024*1024*1024)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">77</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">78</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="comment">#})</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">79</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">80</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">81</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shinyApp</span><span class="paren">(</span><span class="identifier">ui</span>, <span class="identifier">server</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">82</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"setup_disk.frame: gui must be set to either TRUE or FALSE"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">84</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">85</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
@@ -2271,3080 +2404,6566 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/data.table.r" class="hidden">
+            <div id="R/csv2disk.frame.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' [ interface for disk.frame using fst backend</span></pre>
+                      <pre class="language-r"><span class="comment">#' Convert CSV file(s) to disk.frame format</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... same as data.table</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_delete</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param keep the columns to srckeep</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param rbind Whether to rbind the chunks. Defaults to TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param infile The input CSV file or files</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param use.names Same as in data.table::rbindlist</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir The directory to output the disk.frame to</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param fill Same as in data.table::rbindlist</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param inmapfn A function to be applied to the chunk read in from CSV before</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param idcol Same as in data.table::rbindlist</span></pre>
+                      <pre class="language-r"><span class="comment">#'   the chunk is being written out. Commonly used to perform simple</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst </span></pre>
+                      <pre class="language-r"><span class="comment">#'   transformations. Defaults to the identity function (ie. no transformation)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks Number of chunks to output</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table rbindlist </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param in_chunk_size When reading in the file, how many lines to read in at</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom globals findGlobals</span></pre>
+                      <pre class="language-r"><span class="comment">#'   once. This is different to nchunks which controls how many chunks are</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#'   output</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby The column(s) to shard the data by. For example suppose</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   `shardby = c("col1","col2")`  then every row where the values `col1` and</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' speed_limit = 50</span></pre>
+                      <pre class="language-r"><span class="comment">#'   `col2` are the same will end up in the same chunk; this will allow merging</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df[speed &lt; speed_limit ,.N, cut(dist, pretty(dist))]</span></pre>
+                      <pre class="language-r"><span class="comment">#'   by `col1` and `col2` to be more efficient</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress For fst backends it's a number between 0 and 100 where 100 is</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#'   the highest compression ratio.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite Whether to overwrite the existing directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">`[.disk.frame`</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">rbind</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param header Whether the files have header. Defaults to TRUE</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">22</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep_for_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">24</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">substitute</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="comment">#this is an alist</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param backend The CSV reader backend to choose: "data.table" or "readr". </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   disk.frame does not have its own CSV reader. It uses either</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">26</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ag</span> <span class="operator">=</span> <span class="identifier">globals</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">findGlobals</span><span class="paren">(</span><span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   data.table::fread or readr::read_delimited. It is worth noting that</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">27</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ag</span> <span class="operator">=</span> <span class="identifier">setdiff</span><span class="paren">(</span><span class="identifier">ag</span>, <span class="string">""</span><span class="paren">)</span> <span class="comment"># "" can cause issues with future</span></pre>
+                      <pre class="language-r"><span class="comment">#'   data.table::fread does not detect dates and all dates are imported as</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   strings, and you are encouraged to use {fasttime} to convert the strings to</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">29</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   date. You can use the `inmapfn` to do that. However, if you want automatic</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {</span></pre>
+                      <pre class="language-r"><span class="comment">#'   date detection, then backend="readr" may suit your needs. However, readr</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">31</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">chunk</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep_for_future</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   is often slower than data.table, hence data.table is chosen as the default.</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">32</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk_reader Even if you choose a backend there can still be multiple</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">33</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">expr</span> <span class="operator">&lt;-</span> <span class="identifier">quote</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   strategies on how to approach the CSV reads. For example, data.table::fread</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">34</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">expr</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">expr</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   tries to mmap the whole file which can cause the whole read process to</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">35</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">&lt;-</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">`[`</span>, <span class="identifier">expr</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   fail. In that case we can change the chunk_reader to "readLines" which uses the</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">36</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span></pre>
+                      <pre class="language-r"><span class="comment">#'   readLines function to read chunk by chunk and still use data.table::fread</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">37</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">future.globals</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"df"</span>, <span class="string">"keep_for_future"</span>, <span class="string">"dotdotdot"</span>, <span class="identifier">ag</span><span class="paren">)</span>, <span class="identifier">future.packages</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"data.table"</span>,<span class="string">"disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   to process the chunks. There are currently no strategies for readr backend,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   except the default one.</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">39</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rbind</span> <span class="operator">&amp;</span> <span class="identifier">all</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">res</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to data.table::fread, disk.frame::as.disk.frame,</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">40</td>
-                    <td class="coverage">3<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   disk.frame::shard</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">41</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rbind</span><span class="paren">)</span>  <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">42</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#@importFrom LaF detect_dm_csv process_blocks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom bigreadr split_file get_split_files</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">44</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span></pre>
+                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' tmpfile = tempfile()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Solutions from https://stackoverflow.com/questions/57122960/how-to-use-non-standard-evaluation-nse-to-evaluate-arguments-on-data-table?answertab=active#tab-top</span></pre>
+                      <pre class="language-r"><span class="comment">#' write.csv(cars, tmpfile)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># `[.dd` &lt;- function(x, ...) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' tmpdf = tempfile(fileext = ".df")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   code &lt;- rlang::enexprs(...)</span></pre>
+                      <pre class="language-r"><span class="comment">#' df = csv_to_disk.frame(tmpfile, outdir = tmpdf, overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   lapply(x, function(dt) {</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     ex &lt;- rlang::expr(dt[!!!code])</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     rlang::eval_tidy(ex)</span></pre>
+                      <pre class="language-r"><span class="comment">#' fs::file_delete(tmpfile)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   })</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># }</span></pre>
+                      <pre class="language-r"><span class="identifier">csv_to_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># </span></pre>
+                      <pre class="language-r">                              <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"data.table"</span>, <span class="string">"readr"</span>, <span class="string">"LaF"</span><span class="paren">)</span>, <span class="identifier">chunk_reader</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"bigreadr"</span>, <span class="string">"data.table"</span>, <span class="string">"readr"</span>, <span class="string">"readLines"</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">57</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># </span></pre>
+                      <pre class="language-r">  <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">backend</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">58</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># `[.dd` &lt;- function(x,...) {</span></pre>
+                      <pre class="language-r">  <span class="identifier">chunk_reader</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">chunk_reader</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">59</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   a &lt;- substitute(...()) #this is an alist</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">60</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   expr &lt;- quote(x[[i]])</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span> <span class="operator">|</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">61</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   expr &lt;- c(expr, a)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"readr"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">62</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   res &lt;- list()</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: You have chosen backend = 'readr' or chunk_reader = 'readr'. But `readr` package is not installed. To install run: `install_packages(\"readr\")`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   for (i in seq_along(x)) {</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     res[[i]] &lt;- do.call(`[`, expr)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   }</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   res</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">67</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># }</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/rechunk.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Increase or decrease the number of chunks in the disk.frame</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df the disk.frame to rechunk</span></pre>
+                      <pre class="language-r">  <span class="comment"># we need multiple backend because data.table has poor support for when the file is larger than RAM</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
+                      <pre class="language-r">  <span class="comment"># https://github.com/Rdatatable/data.table/issues/3526</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby the shardkeys</span></pre>
+                      <pre class="language-r">  <span class="comment"># TODO detect these cases</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the output directory</span></pre>
+                      <pre class="language-r">  <span class="comment"># user has requested chunk-wise reading but wants me to do it</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
+                      <pre class="language-r">  <span class="comment">#if(is.null(in_chunk_size)) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="comment">#} else if(is.character(in_chunk_size) &amp;&amp; in_chunk_size == "guess") {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # create a disk.frame with 2 chunks in tempdir()</span></pre>
+                      <pre class="language-r">    <span class="comment">#library(bigreadr)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 2)</span></pre>
+                      <pre class="language-r">    <span class="comment"># system.time(wc_l &lt;- R.utils::countLines(infile))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="comment"># system.time(infos_split &lt;- split_file(infile, every_nlines = 1e7))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # re-chunking cars.df to 3 chunks, done "in-place" to the same folder as cars.df</span></pre>
+                      <pre class="language-r">    <span class="comment"># file_parts &lt;- get_split_files(infos_split)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' rechunk(cars.df, 3)</span></pre>
+                      <pre class="language-r">   </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  <span class="comment">#} else</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">18</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">85</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' new_path = tempfile(fileext = ".df")</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">19</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">86</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # re-chunking cars.df to 4 chunks, shard by speed, and done "out-of-place" to a new directory</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span><span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">87</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2.df = rechunk(cars.df, 4, outdir=new_path, shardby = "speed")</span></pre>
+                      <pre class="language-r">      <span class="identifier">rs</span> <span class="operator">=</span> <span class="identifier">df_ram_size</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">22</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">89</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">file.size</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">3</span><span class="paren">)</span><span class="operator">&gt;</span> <span class="identifier">rs</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">90</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: using backend = 'data.table' and chunk_reader = 'data.table'."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">91</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"But one of your input files is larger than available RAM {rs}."</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">92</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rechunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"if the file(s) fail to read, please set chunk_reader = 'readLines' or chunk_reader = 'readr'."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">26</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">93</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"E.g. csv_to_disk.frame(..., chunk_reader = 'readr')"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">94</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># we need to force the chunks to be computed first as it's common to make nchunks a multiple of chunks(df)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">95</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># but if we do it too late then the folder could be empty</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">96</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span> </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">97</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">5<em>x</em></td>
+                    <td class="num">98</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">&lt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">32</td>
+                    <td class="num">99</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nchunks must be larger than 1"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: Reading multiple input files."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">100</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="comment">#param_names = names(list(...))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">102</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">103</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">5<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">user_had_not_set_shard_by</span> <span class="operator">=</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#if (!"colClasses" %in% param_names) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">104</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">user_had_set_shard_by</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">user_had_not_set_shard_by</span></pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please use `colClasses = `  to set column types to minimize the chance of a failed read"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">105</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment">#}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">40</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">106</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># back up the files if writing to the same directory</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">107</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">outdir</span> <span class="operator">==</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment">#if (!"col_types" %in% param_names) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">108</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">back_up_tmp_dir</span> <span class="operator">&lt;-</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"back_up_tmp_dir"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please use `col_types = ` to set column types to minimize the chance of a failed read"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">109</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">44</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">110</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">111</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_copy</span><span class="paren">(</span></pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please check the documentation of {LaF} for how to set column classes. For example type `?LaF`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">112</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span>, <span class="comment">#from</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">113</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span>, <span class="string">".metadata"</span><span class="paren">)</span> <span class="comment">#to</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend {backend} not supported"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">114</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">116</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># back-up the files first</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">51</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">117</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">full_files</span> <span class="operator">=</span> <span class="identifier">dir</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">52</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">118</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">short_files</span> <span class="operator">=</span> <span class="identifier">dir</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"LaF"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">53</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">119</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"You need to install the LaF package to use backend = 'LaF'. To install: install.packages('LaF')"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">120</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># move all files to the back up folder</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">55</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">121</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">full_files</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">56</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">122</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend = 'LaF' only supports single file, not multiple files as `infile`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">123</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">124</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">59</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">125</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">126</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend = 'LaF' can only be used when in_chunk_size != NULL"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">127</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">128</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">129</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># TODO check for validity</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">130</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"files have been backed up to temporary dir {back_up_tmp_dir}. You can recover there files until you restart your R session"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">65</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">131</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="identifier">df_out</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">66</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">132</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">dm</span> <span class="operator">=</span> <span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detect_dm_csv</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">67</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">133</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">process_blocks</span><span class="paren">(</span><span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">laf_open</span><span class="paren">(</span><span class="identifier">dm</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">past</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">68</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">134</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">135</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span> <span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">136</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df_out</span>, <span class="identifier">chunk</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">137</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">138</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">139</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">140</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">141</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">df_out</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">142</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">143</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">csv_to_disk.frame_data.table_backend</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">144</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">145</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">outdir</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">146</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">inmapfn</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">147</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">nchunks</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">148</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">149</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">shardby</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">150</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">compress</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">151</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">overwrite</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">152</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">header</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">153</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">.progress</span>, <span class="keyword">...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">154</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">155</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"bigreadr"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">156</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment"># use bigreadr to split the files</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">157</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">tf</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">158</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">pt</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">159</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">160</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Stage 1 of 2: splitting the file {infile} into smallers files:"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">161</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Destination: {tf}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">162</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">163</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">164</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">split_file_info</span> <span class="operator">=</span> <span class="identifier">bigreadr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">split_file</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">165</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">166</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">every_nlines</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">167</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">prefix_out</span> <span class="operator">=</span> <span class="identifier">tf</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">168</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">repeat_header</span> <span class="operator">=</span> <span class="identifier">header</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">169</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">files_split</span> <span class="operator">=</span> <span class="identifier">bigreadr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_split_files</span><span class="paren">(</span><span class="identifier">split_file_info</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">170</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 1 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">171</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">172</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">173</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">pt2</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">174</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Stage 2 of 2: Converting the smaller files into disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">175</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">176</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">177</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">csv_to_disk.frame</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">178</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">files_split</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">179</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">180</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">inmapfn</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">181</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">182</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">183</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">184</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">185</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">186</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">187</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">backend</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">188</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">189</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">190</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">191</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">192</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">193</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 &amp; 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">194</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">195</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">196</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">197</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readLines"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">198</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">199</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="comment"># establish a read connection to the file</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">200</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">con</span> <span class="operator">=</span> <span class="identifier">file</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="string">"r"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">201</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">con</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">202</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">readLines</span><span class="paren">(</span><span class="identifier">con</span>, <span class="identifier">n</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">203</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">diskf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">204</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">header_copy</span> <span class="operator">=</span> <span class="identifier">header</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">205</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">206</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">xx</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">207</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">colnames_copy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">208</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header_copy</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">209</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">210</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">211</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="comment"># TODO detect the correct delim; manually adding header</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">212</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">header_colnames</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">colnames_copy</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">","</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">213</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">header_colnames</span>, <span class="identifier">xx</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">214</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">215</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">216</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">217</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">218</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">219</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">220</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">221</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">222</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">223</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">224</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">diskf</span>, <span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">225</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">readLines</span><span class="paren">(</span><span class="identifier">con</span>, <span class="identifier">n</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">226</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">header_copy</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">227</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">228</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">diskf</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">229</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">230</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"chunk_reader = 'readLines' is not yet supported for multiple files"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">231</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">232</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readr"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">233</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">234</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">diskf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">235</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">236</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">237</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_lines_chunked</span><span class="paren">(</span><span class="identifier">file</span> <span class="operator">=</span> <span class="identifier">infile</span>, <span class="identifier">callback</span> <span class="operator">=</span> <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="keyword">function</span><span class="paren">(</span><span class="identifier">xx</span>, <span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">238</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">239</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">colnames_copy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">240</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">241</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">242</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">243</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">244</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">245</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">246</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">247</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">colnames_copy</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">248</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">249</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">header_colnames</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">colnames_copy</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">","</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">250</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">header_colnames</span>, <span class="identifier">xx</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">251</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">252</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">253</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">254</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">255</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">256</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">257</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">258</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">259</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">diskf</span>, <span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">260</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, <span class="identifier">progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">261</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">262</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">diskf</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">263</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">264</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"chunk_reader = 'readr' is not yet supported for multiple files"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">265</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">266</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">267</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment"># if(is.null(in_chunk_size)) {</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">268</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment">#   stop("for readr backend, only in_chunk_size != NULL is supported")</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">269</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment"># } else if (!is.null(shardby)) {</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">270</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment">#   stop("for readr backend, only shardby == NULL is supported")</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">271</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment"># }</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">272</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">csv_to_disk.frame_readr</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">273</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">274</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">275</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">inmapfn</span><span class="operator">=</span><span class="identifier">inmapfn</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">276</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">nchunks</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">277</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">in_chunk_size</span><span class="operator">=</span><span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">278</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">shardby</span><span class="operator">=</span><span class="identifier">shardby</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">279</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">compress</span><span class="operator">=</span><span class="identifier">compress</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">280</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">overwrite</span><span class="operator">=</span><span class="literal">TRUE</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">281</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">col_names</span><span class="operator">=</span><span class="identifier">header</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">282</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">.progress</span><span class="operator">=</span><span class="identifier">.progress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">283</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">284</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: this set of options is not supported"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">285</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">286</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">287</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">288</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">289</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">csv_to_disk.frame_data.table_backend</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">290</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                                                 <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">291</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="comment"># reading multiple files</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">292</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">293</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">294</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">origarg</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">inmapfn</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">295</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                   <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">296</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                   <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">297</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">dotdotdotorigarg</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">dotdotdot</span>, <span class="identifier">origarg</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">298</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">299</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">pt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">300</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">301</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"================================================="</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">302</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">303</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">304</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"-- Converting CSVs to disk.frame -- Stage 1 of 2:"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">305</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">306</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Converting {length(infile)} CSVs to {nchunks} disk.frames each consisting of {nchunks} chunks"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">307</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">308</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">309</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">310</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">outdf_tmp</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_imap</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">311</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">dotdotdotorigarg1</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">dotdotdotorigarg</span>, <span class="identifier">list</span><span class="paren">(</span><span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tempdir</span><span class="paren">(</span><span class="paren">)</span>, <span class="identifier">.y</span><span class="paren">)</span>, <span class="identifier">infile</span><span class="operator">=</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">312</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">313</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">csv_to_disk.frame_data.table_backend</span>, <span class="identifier">dotdotdotorigarg1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">314</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">315</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">316</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">317</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"-- Converting CSVs to disk.frame -- Stage 1 or 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">318</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">319</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">320</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">321</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">322</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">323</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">"-- Converting CSVs to disk.frame -- Stage 2 of 2:"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">324</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">325</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Row-binding the {nchunks} disk.frames together to form one large disk.frame:"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">326</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Creating the disk.frame at {outdir}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">327</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">328</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">pt2</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">329</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">outdf</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">outdf_tmp</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">330</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">331</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">332</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">333</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">334</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">335</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 1 &amp; 2 in total took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">336</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">337</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">338</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">outdf</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">339</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># reading one file</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">340</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">341</td>
+                    <td class="coverage">8<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">342</td>
+                    <td class="coverage">6<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">343</td>
+                    <td class="coverage">6<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">as.disk.frame</span><span class="paren">(</span><span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span><span class="operator">=</span><span class="identifier">header</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">outdir</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="identifier">compress</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">344</td>
+                    <td class="coverage">6<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">345</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">346</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">outdf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">347</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="number">0</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">348</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">tmpdir1</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">pattern</span><span class="operator">=</span><span class="string">"df_tmp"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">349</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">350</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">351</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">352</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">353</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">column_names</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">354</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">355</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">column_names</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">356</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">357</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">358</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">359</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">column_names</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">360</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">361</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">362</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="keyword">if</span> <span class="paren">(</span><span class="string">"col.names"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ddd</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">363</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">364</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">365</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">366</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">367</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">368</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">369</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">370</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">371</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">col.names</span> <span class="operator">=</span> <span class="identifier">column_names</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">372</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">373</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">374</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">375</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">376</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="identifier">skiprows</span> <span class="operator">+</span> <span class="identifier">in_chunk_size</span> <span class="operator">+</span> </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">377</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="comment"># skips the header as well but only at the first chunk</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">378</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">i</span> <span class="operator">==</span> <span class="number">1</span> <span class="operator">&amp;</span> <span class="identifier">header</span>, <span class="number">1</span>, <span class="number">0</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">379</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">rows</span> <span class="operator">&lt;-</span> <span class="identifier">tmpdt</span><span class="paren">[</span>,<span class="identifier">.N</span><span class="paren">]</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">380</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rows</span> <span class="operator">&lt;</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">381</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">done</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">382</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">383</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">384</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="comment"># add to chunk</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">385</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">outdf</span>, <span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">386</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">387</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">388</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">389</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"read {in_chunk_size*(i-1) + rows} rows from {infile}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">390</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">391</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment"># remove the files</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">392</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">393</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">394</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># so shard by some element</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">395</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">396</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">397</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span><span class="operator">=</span><span class="identifier">header</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">398</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">399</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">400</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="number">0</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">401</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">tmpdir1</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">pattern</span><span class="operator">=</span><span class="string">"df_tmp"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">402</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">403</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#message(tmpdir1)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">404</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">405</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">406</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">407</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">column_names</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">408</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">409</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">column_names</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">410</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">411</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">412</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">413</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">column_names</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">414</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">415</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">416</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="keyword">if</span> <span class="paren">(</span><span class="string">"col.names"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ddd</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">417</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">418</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">419</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">420</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">421</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">422</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">423</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">424</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">425</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">col.names</span> <span class="operator">=</span> <span class="identifier">column_names</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">426</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">427</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">428</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">429</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">430</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="identifier">skiprows</span> <span class="operator">+</span> <span class="identifier">in_chunk_size</span> <span class="operator">+</span> </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">431</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="comment"># skips the header as well but only at the first chunk</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">432</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">i</span> <span class="operator">==</span> <span class="number">1</span> <span class="operator">&amp;</span> <span class="identifier">header</span>, <span class="number">1</span>, <span class="number">0</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">433</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">rows</span> <span class="operator">&lt;-</span> <span class="identifier">tmpdt</span><span class="paren">[</span>,<span class="identifier">.N</span><span class="paren">]</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">434</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rows</span> <span class="operator">&lt;</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">435</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">done</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">436</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">437</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">438</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">tmp.disk.frame</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">439</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">tmpdt</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">440</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">441</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">442</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmpdir1</span>,<span class="identifier">i</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">443</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">444</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">445</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">446</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">447</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">448</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"read {in_chunk_size*(i-1) + rows} rows from {infile}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">449</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">450</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment"># do not run this in parallel as the level above this is likely in parallel</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">451</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment"># ZJ:</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">452</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">system.time</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">453</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">fnl_out</span> <span class="operator">&lt;-</span> </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">454</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">            <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">455</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">lapply</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">456</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                <span class="identifier">list.files</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">457</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                  <span class="identifier">tmpdir1</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">disk.frame</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">458</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">              <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">parallel</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">459</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">460</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment"># remove the files</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">461</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">462</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">463</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">464</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">465</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">466</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">467</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">468</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/csv2disk.frame_readr.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#@importFrom readr DataFrameCallback</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @noMd</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">csv_to_disk.frame_readr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">                              <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">col_names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">delim</span><span class="operator">=</span><span class="string">","</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">6</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="comment">#</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">8</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="comment"># TODO check header</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">11</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">12</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">13</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">14</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">as.disk.frame</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">15</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">inmapfn</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">16</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">17</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">18</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">19</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">24</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">shard</span><span class="paren">(</span><span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">27</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">28</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">tmp_dir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">29</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">tmp_dir</span>, <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">30</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df_tmp</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">tmp_dir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">31</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">f</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">pos</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">32</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df_tmp</span>, <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">35</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame reader backend: Stage 1/1 -- reading file"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">36</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim_chunked</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="identifier">f</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,  <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">38</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"csv_to_disk.frame reader backend: Stage 2/2 -- performing shardby {shardby}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">39</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df_tmp</span>,<span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>,<span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">40</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df_tmp</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">42</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">f</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">pos</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">44</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">46</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim_chunked</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="identifier">f</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,  <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">47</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">48</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">51</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/sortablestr2i.R" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Alternative to hashstr2i that can produce semi-sorted chunks</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Apply as e.g.:</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># split_values &lt;- cmap(dff, sample_n, size=1) %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#   select(c("id1", "id2")) %&gt;%</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#   collect() %&gt;%</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#   arrange(id1, id2)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># shard_by_rule &lt;- splitstr2i(split_values)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># code = glue::glue("df[,.out.disk.frame.id := {shard_by_rule}]")</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Check if date</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">12</td>
+                    <td class="coverage">76<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">is.date</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">inherits</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">'Date'</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Escapes names</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Factors are converted to numbers</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">escape_name</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">17</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.factor</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">18</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"as.numeric("</span>, <span class="identifier">name</span>, <span class="string">")"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">20</td>
+                    <td class="coverage">36<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">name</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Escapes values</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Strings and dates are quoted</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Factors are converted to number</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">27</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">escape_value</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">28</td>
+                    <td class="coverage">76<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.character</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">is.date</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">29</td>
+                    <td class="coverage">48<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"\""</span>, <span class="identifier">x</span>, <span class="string">"\""</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">30</td>
+                    <td class="coverage">28<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.factor</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">32</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">24<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">x</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">35</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">36</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Switch condition - returns</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">38</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># ({name} &lt; {split_value} | ({name} == {split_value} ...</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">switchcond</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">{</span> </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"("</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">42</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="identifier">escape_name</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">name</span> <span class="operator">%in%</span> <span class="identifier">desc_vars</span>, <span class="string">" &lt; "</span>, <span class="string">" &gt; "</span><span class="paren">)</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">44</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="identifier">escape_value</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="string">" | ("</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="identifier">name</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="string">" == "</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">38<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">         <span class="identifier">escape_value</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">51</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">52</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># Composes the switch conditions, so each split row becomes</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">53</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># ({name1} &lt; {split_value1} | ({name1} == {split_value1} &amp; </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">54</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#    ({name2} &lt; {split_value2} | ({name2} == {split_value2} ...)))) * 1</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">55</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># the sum of the split row is the id</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">sortablestr2i</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">do.call</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">58</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">paste</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">c</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">lapply</span><span class="paren">(</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">61</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">as.list</span><span class="paren">(</span><span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">paste</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">lapply</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">)</span>, <span class="identifier">switchcond</span>, <span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span>, <span class="identifier">sep</span><span class="operator">=</span><span class="string">" &amp; "</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">62</td>
+                    <td class="coverage">122<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"("</span>, <span class="identifier">x</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">rep</span><span class="paren">(</span><span class="string">")"</span>, <span class="identifier">ncol</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">)</span> <span class="operator">*</span> <span class="number">2</span> <span class="operator">+</span> <span class="number">1</span><span class="paren">)</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">""</span><span class="paren">)</span>, <span class="string">"* 1"</span><span class="paren">)</span><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">63</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">)</span>,</pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">26<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">sep</span> <span class="operator">=</span> <span class="string">" + "</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">65</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">66</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">67</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/shardkey.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' Returns the shardkey (not implemented yet)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @importFrom jsonlite fromJSON</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment"># TODO make this work</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">shardkey</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">7</td>
+                    <td class="coverage">321<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">meta_file</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>,<span class="string">".metadata"</span>, <span class="string">"meta.json"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">8</td>
+                    <td class="coverage">321<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">meta_file</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">9</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">11</td>
+                    <td class="coverage">321<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">meta</span> <span class="operator">=</span> <span class="identifier">jsonlite</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fromJSON</span><span class="paren">(</span><span class="identifier">meta_file</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">12</td>
+                    <td class="coverage">321<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">list</span><span class="paren">(</span><span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">meta</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">meta</span><span class="operator">$</span><span class="identifier">shardchunks</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' Compare two disk.frame shardkeys</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param sk1 shardkey1</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param sk2 shardkey2</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">shardkey_equal</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">sk1</span>, <span class="identifier">sk2</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">21</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="operator">==</span> <span class="string">""</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="comment"># if the shardkey is not set then it's the same as having no shardkey</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">23</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">25</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="operator">==</span> <span class="identifier">sk2</span><span class="operator">$</span><span class="identifier">skardkey</span><span class="paren">)</span> <span class="operator">&amp;&amp;</span> <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardchunks</span> <span class="operator">==</span> <span class="identifier">sk2</span><span class="operator">$</span><span class="identifier">shardchunks</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/dplyr_verbs.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' The dplyr verbs implemented for disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @description Please see the dplyr document for their usage. Please note</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">71</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dfp</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' `chunk_arrange` performs the actions within each chunk</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">72</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">existing_shardkey</span> <span class="operator">=</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select rename filter mutate transmute arrange do groups</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># by default, if shardkey is defined then rechunk will continue to reuse it</span></pre>
+                      <pre class="language-r"><span class="comment">#'   group_by group_by glimpse summarise</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">75</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... Same as the dplyr functions</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">76</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">existing_shardkey</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .data a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @family dplyr verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">80</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">user_had_set_shard_by</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' library(dplyr)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">81</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">82</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardby</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' mult = 2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">83</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if no existing shardby </span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">84</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nr</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # use all any of the supported dplyr</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' cars2 = cars.df %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#'   select(speed) %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#'   mutate(speed2 = speed * mult) %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#'   filter(speed &lt; 50) %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#'   rename(speed1 = speed) %&gt;% </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#'   collect</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">select.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">85</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">27</td>
+                    <td class="coverage">11<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nr_per_chunk</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nr</span><span class="operator">/</span><span class="identifier">nchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">86</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">28</td>
+                    <td class="coverage">11<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">87</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">29</td>
+                    <td class="coverage">56<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                      <pre class="language-r">    <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">88</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">30</td>
+                    <td class="coverage">56<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">chunks_read</span> <span class="operator">=</span> <span class="number">1</span></pre>
+                      <pre class="language-r">    <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">89</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">31</td>
+                    <td class="coverage">11<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">32</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' Kept for backwards-compatibility to be removed in 0.3</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">35</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">36</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="identifier">create_dplyr_mapper</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">37</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">stop</span><span class="paren">(</span><span class="string">"create_dplyr_mapper has been deprecated. Please use create_chunk_mapper instead"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">38</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">41</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">90</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">42</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">rename.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">91</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">92</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">44</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">93</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">while</span><span class="paren">(</span><span class="identifier">chunks_read</span> <span class="operator">&lt;</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">94</td>
-                    <td class="coverage">30<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">46</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">nr_per_chunk</span> <span class="operator">&lt;=</span> <span class="identifier">used_so_far</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">95</td>
-                    <td class="coverage">14<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">a</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nr_per_chunk</span>,<span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">filter.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">96</td>
-                    <td class="coverage">14<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">48</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="identifier">chunks_written</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">97</td>
-                    <td class="coverage">14<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">a</span><span class="paren">[</span><span class="operator">-</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nr_per_chunk</span><span class="paren">)</span>,<span class="paren">]</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">98</td>
-                    <td class="coverage">14<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">99</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">100</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">52</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunks_read</span> <span class="operator">=</span> <span class="identifier">chunks_read</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_all</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">101</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">53</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">newa</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunks_read</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">filter_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">102</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">54</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">used_so_far</span> <span class="operator">+</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">newa</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">103</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">55</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">a</span>, <span class="identifier">newa</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">104</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">newa</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">105</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">106</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_if</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">107</td>
+                    <td class="num">59</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">filter_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">108</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">60</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">while</span><span class="paren">(</span><span class="identifier">chunks_written</span> <span class="operator">&lt;</span> <span class="identifier">nchunks</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">109</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">61</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rows_to_write</span> <span class="operator">=</span> <span class="identifier">min</span><span class="paren">(</span><span class="identifier">nr_per_chunk</span>, <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">110</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">62</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">a</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">rows_to_write</span>,<span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">111</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">63</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">a</span><span class="paren">[</span><span class="operator">-</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">rows_to_write</span><span class="paren">)</span>,<span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">112</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">64</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="identifier">chunks_written</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_at</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">113</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">filter_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">114</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">115</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">67</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">116</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">68</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># if there is existing shard by; shardby has been replaced with new shard by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">117</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">69</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">user_had_not_set_shard_by</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">118</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">70</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"shardby = NULL; but there are already shardkey's defined for this disk.frame. Therefore a rechunk algorithm that preserves the shardkey's has been applied and this algorithm is slower than an algorithm that doesn't use a shardkey."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future getGlobalsAndPackages</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">119</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom rlang eval_tidy quo enquos</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">120</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">121</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># using some maths we can cut down on the number of operations</span></pre>
+                      <pre class="language-r"><span class="identifier">mutate.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">122</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">74</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nc</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">123</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">124</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># TODO there is bug here! If the chunks are in numbers form!</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">125</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if the number of possible new chunk ids is one then no need to perform anything. just merge those</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr transmute</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">126</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">78</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">possibles_new_chunk_id</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nc</span>, <span class="operator">~</span><span class="identifier">unique</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">.x</span><span class="operator">-</span><span class="number">1</span> <span class="operator">+</span> <span class="paren">(</span><span class="number">0</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="operator">-</span><span class="number">1</span><span class="paren">)</span><span class="paren">)</span><span class="operator">*</span><span class="identifier">nc</span><span class="paren">)</span> <span class="operator">%%</span> <span class="identifier">nchunks</span><span class="paren">)</span><span class="operator">+</span><span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">127</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">79</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">lp</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_int</span><span class="paren">(</span><span class="identifier">possibles_new_chunk_id</span>,<span class="identifier">length</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">transmute.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">transmute</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">128</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">129</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#need to shards</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">130</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">82</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nts</span> <span class="operator">=</span> <span class="identifier">which</span><span class="paren">(</span><span class="identifier">lp</span> <span class="operator">!=</span> <span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">131</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">132</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">84</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">bad_boys</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">nts</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">133</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">85</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df1</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">arrange.disk.frame</span> <span class="operator">=</span><span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span>, <span class="identifier">warning_msg</span><span class="operator">=</span><span class="string">"`arrange.disk.frame` is now deprecated. Please use `chunk_arrange` instead. This is in preparation for a more powerful `arrange` that sorts the whole disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">134</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">86</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">135</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">136</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">137</td>
+                    <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># for those that don't need to be resharded</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">138</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">90</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp_fdlr</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"rechunk_shard"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">139</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">91</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_arrange</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">140</td>
+                    <td class="num">92</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">141</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">93</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">oks</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="identifier">which</span><span class="paren">(</span><span class="identifier">lp</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">142</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">94</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">file_chunk</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">i</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">143</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">95</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">file_chunk</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span>, <span class="identifier">possibles_new_chunk_id</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr tally</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">144</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">96</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">145</td>
+                    <td class="num">97</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">tally.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">tally</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">146</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">147</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">99</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">list_of_sharded</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">bad_boys</span>, <span class="identifier">oks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">148</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">100</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">new_one</span> <span class="operator">&lt;-</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">list_of_sharded</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">149</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr count</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">150</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">102</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">new_one</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">new_one</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">151</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">103</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">count.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">count</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">152</td>
+                    <td class="num">104</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">153</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">105</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"rechunk: option not supported"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment"># TODO family is not required is group-by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">154</td>
+                    <td class="num">106</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment"># TODO alot of these .disk.frame functions are not generic</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">155</td>
+                    <td class="num">107</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/sas2disk_frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">108</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Convert a SAS file (.sas7bdat) format to CSV or disk.frame by chunk</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">109</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param infile the SAS7BDAT file</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">110</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunk which convert of nchunks to convert</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr add_count</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">111</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">112</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sas2csvpath path to sas2csv.exe</span></pre>
+                      <pre class="language-r"><span class="identifier">add_count.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_count</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">113</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sep separater of the CSV file, defaults to |</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">114</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">116</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">sas_to_csv</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">chunk</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">sas2csvpath</span> <span class="operator">=</span> <span class="string">"sas2csv/sas2csv.exe"</span>, <span class="identifier">sep</span><span class="operator">=</span><span class="string">"|"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr add_tally</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">10</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">117</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">sas2csvpath</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">11</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">118</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"You must have the sas2csv.exe installed. Only Windows is supported at the moment. Please contact the author"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">add_tally.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_tally</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">119</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">13</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">120</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">sasfile</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'"{infile}"'</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">14</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">121</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">15</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">122</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span>, <span class="identifier">chunk</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">16</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">123</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">options</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"-o outcsv/{chunk}/ -d {sep} -c -n {nchunks} -k {paste(chunk-1,collapse = ' ')} -m"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname chunk_group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">124</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarize</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">18</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">125</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">cmd</span> <span class="operator">=</span> <span class="identifier">paste</span><span class="paren">(</span><span class="identifier">sas2csvpath</span>, <span class="identifier">sasfile</span>, <span class="identifier">options</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">19</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">126</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">system</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">127</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">128</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">129</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Convert a SAS file (.sas7bdat format) to disk.frame via CSVs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname chunk_group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">130</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param inpath input SAS7BDAT file</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarise</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">131</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outpath output disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">132</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">133</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sep separater of the intermediate CSV file, defaults to |</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">134</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param remove_csv TRUE/FALSE. Remove the intermediate CSV after usage?</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">135</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future %&lt;-%</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr do</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">136</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
+                      <pre class="language-r"><span class="identifier">do.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">137</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">138</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">sas_to_disk.frame</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">inpath</span>, <span class="identifier">outpath</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">inpath</span><span class="paren">)</span>, <span class="identifier">sas2csvpath</span> <span class="operator">=</span> <span class="string">"sas2csv/sas2csv.exe"</span>, <span class="identifier">sep</span> <span class="operator">=</span> <span class="string">"|"</span>, <span class="identifier">remove_csv</span> <span class="operator">=</span> <span class="literal">T</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">32</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">139</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nchunks</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">33</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">140</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ready</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="literal">F</span>, <span class="identifier">nchunks</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">141</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># ready = c(rep(T, 96), rep(F, 4))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_all</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">35</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">142</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">extracting</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="literal">F</span>, <span class="identifier">nchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_group_by_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">143</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">37</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">144</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outpath</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">38</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">145</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">146</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">40</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">147</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">print</span><span class="paren">(</span><span class="string">"this program converts SAS datasets to CSV first before conversion to disk.frame."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_at</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">148</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"the intermediate CSVs are here: {file.path(getwd(), 'outcsv')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_group_by_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">149</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">150</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">ready</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">151</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">F</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">45</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">152</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">extracting_jobs</span> <span class="operator">=</span> <span class="literal">F</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">153</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">for</span><span class="paren">(</span><span class="identifier">w</span> <span class="keyword">in</span> <span class="identifier">which</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">ready</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_if</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">154</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">incsv</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span>, <span class="identifier">w</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"_"</span>, <span class="identifier">w</span><span class="operator">-</span><span class="number">1</span>,<span class="string">".csv"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_group_by_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">48</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">155</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">49</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">156</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">T</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">50</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">157</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">ready</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span> <span class="operator">=</span> <span class="literal">T</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">51</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">158</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">ok</span> <span class="operator">%&lt;-%</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">159</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst.tmp"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_all</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">53</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">160</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">file.rename</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst.tmp"</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">mutate_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">54</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">161</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">remove_csv</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">162</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">file.remove</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">163</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">57</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">164</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">165</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_at</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">59</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">166</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"converting: {w} of {nchunks}; time: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">mutate_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">60</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">167</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">extracting_jobs</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">extracting</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">168</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">62</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">169</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">T</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">63</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">170</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">extracting_jobs</span> <span class="operator">=</span> <span class="literal">T</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">64</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">171</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">extracting</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span> <span class="operator">&lt;-</span> <span class="literal">T</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_if</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">65</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">172</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">ok</span> <span class="operator">%&lt;-%</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">mutate_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">66</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">173</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">sas_to_csv</span><span class="paren">(</span><span class="identifier">inpath</span>, <span class="identifier">w</span>, <span class="identifier">nchunks</span>, <span class="identifier">sas2csvpath</span>, <span class="identifier">sep</span> <span class="operator">=</span> <span class="identifier">sep</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">174</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">68</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">175</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"extracting: {w} of {nchunks}; time: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">176</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">177</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_all</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">178</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">rename_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">72</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">179</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">73</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">180</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"didn't get any work: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">74</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">181</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="number">18</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">182</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">183</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_at</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">184</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">rename_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/semi_join.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">185</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">186</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param y a data.frame or disk.frame. If data.frame then returns lazily; if disk.frame it performs the join eagerly and return a disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">187</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir output directory for disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">188</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname join </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">189</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_if</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">190</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="identifier">rename_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">191</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">192</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">193</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' join.df = semi_join(cars.df, cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">194</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">195</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_all</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">196</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">select_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">197</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">198</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">semi_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_semi_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">15</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">199</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">200</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">17</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">201</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_at</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">202</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="identifier">select_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">19</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">203</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">20</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">204</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">21</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">205</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">206</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">semi_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">23</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">207</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_if</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">208</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">select_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">209</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">210</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">27</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">211</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">212</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">213</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise_all</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">30</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">214</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarise_all</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">215</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">216</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">217</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">218</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">219</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise_at</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">36</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">220</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarise_at</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">221</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">222</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">223</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">semi_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">224</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">225</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_all</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">21<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">226</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarize_all</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_all</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">227</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">44</td>
-                    <td class="coverage">21<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">228</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">45</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">229</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">230</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">21<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">231</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">semi_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="keyword">...</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_at</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">232</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarize_at</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_at</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">233</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">234</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">235</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">236</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">237</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_if</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">238</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_summarize_if</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_if</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">239</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/get_chunk.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">240</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Obtain one chunk by chunk id</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">241</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">242</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param n the chunk id. If numeric then matches by number, if character then returns the chunk with the same name as n</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">243</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param keep the columns to keep</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr distinct</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">244</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param full.names whether n is the full path to the chunks or just a relative path file name. Ignored if n is numeric</span></pre>
+                      <pre class="language-r"><span class="identifier">distinct.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">245</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to fst::read_fst or whichever read function is used in the backend</span></pre>
+                      <pre class="language-r">  <span class="keyword">stop</span><span class="paren">(</span><span class="string">"`distinct.disk.frame` is not available. Please use `chunk_distinct`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">246</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">247</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">248</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 2)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">249</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 1)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">250</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 2)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">251</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 1, keep = "speed")</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr distinct</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">252</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_distinct</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">distinct</span>, <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"the `distinct` function applies distinct chunk-wise"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">253</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # if full.names = TRUE then the full path to the chunk need to be provided</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">254</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, file.path(attr(cars.df, "path"), "1.fst"), full.names = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' The shard keys of the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">255</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @return character</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">256</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">257</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">258</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">get_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">groups.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">20</td>
-                    <td class="coverage">1096<em>x</em></td>
+                    <td class="num">259</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"get_chunk"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">260</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">261</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">262</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Group by within each disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">263</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname get_chunk</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">264</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fst read_fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' The disk.frame group by operation perform group WITHIN each chunk. This is</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">265</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' often used for performance reasons. If the user wishes to perform group-by,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">266</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">get_chunk.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">n</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' they may choose to use the `hard_group_by` function which is expensive as it</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">267</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">1096<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' reorganizes the chunks by the shard key.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">268</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @seealso hard_group_by group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">269</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .data a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">270</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"keep"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to dplyr::group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">271</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">272</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">cmds</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"lazyfn"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname chunk_group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">273</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">274</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="identifier">chunk_group_by</span> <span class="operator">&lt;-</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">275</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">38</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">276</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname chunk_group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">277</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep1</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">40</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">278</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">keep1</span>, <span class="identifier">keep</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">chunk_ungroup</span> <span class="operator">=</span> <span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">ungroup</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">279</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">keep</span> <span class="operator">%in%</span> <span class="identifier">keep1</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">42</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">280</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"some of the variables specified in keep = {keep} is not available"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment"># do not introduce it as it was never introduced</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">281</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#ungroup.disk.frame( &lt; - create_dplyr_mapper(dplyr::ungroup, , warning_msg="`ungroup.disk.frame` is now deprecated. Please use `chunk_ungroup` instead. This is in preparation for a more powerful `group_by` framework")</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">44</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">282</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">283</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">284</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">285</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">286</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">n</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">glimpse.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">28<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">287</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">n</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">glimpse</span><span class="paren">(</span><span class="identifier">head</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">50</td>
-                    <td class="coverage">28<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">288</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">51</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">289</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">n</span><span class="paren">]</span>  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">290</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment"># Internal methods</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">291</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment"># @param .data the data</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">54</td>
-                    <td class="coverage">1068<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">292</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment"># @param cmd the function to record</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">55</td>
-                    <td class="coverage">1041<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">293</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">n</span></pre>
+                      <pre class="language-r"><span class="identifier">record</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="identifier">cmd</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">56</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">294</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>,<span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>,<span class="string">"lazyfn"</span><span class="paren">)</span>, <span class="identifier">list</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">27<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">295</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">n</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">.data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">296</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">297</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">298</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment"># Internal methods</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">299</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># if the file you are looking for don't exist</span></pre>
+                      <pre class="language-r"><span class="comment"># @param .data the disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">1096<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">300</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment"># @param cmds the list of function to play back</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">63</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">301</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The chunk {filename} does not exist; returning an empty data.table"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">play</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="identifier">cmds</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">64</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">302</td>
+                    <td class="coverage">397<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">notbl</span> <span class="operator">&lt;-</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">for</span> <span class="paren">(</span><span class="identifier">cmd</span> <span class="keyword">in</span> <span class="identifier">cmds</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">65</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">303</td>
+                    <td class="coverage">466<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">notbl</span>, <span class="string">"does not exist"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">66</td>
+                    <td class="num">304</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">notbl</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">.data</span> <span class="operator">&lt;-</span> <span class="identifier">cmd</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">305</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">68</td>
+                    <td class="num">306</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment"># create a temporary environment </span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">1096<em>x</em></td>
+                    <td class="num">307</td>
+                    <td class="coverage">466<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">cmds</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">an_env</span> <span class="operator">=</span> <span class="identifier">new.env</span><span class="paren">(</span><span class="identifier">parent</span> <span class="operator">=</span> <span class="identifier">environment</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">70</td>
-                    <td class="coverage">669<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">308</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="operator">!=</span><span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">71</td>
-                    <td class="coverage">669<em>x</em></td>
+                    <td class="num">309</td>
+                    <td class="coverage">466<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">columns</span> <span class="operator">=</span> <span class="identifier">keep</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">ng</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">72</td>
+                    <td class="num">310</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">73</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">311</td>
+                    <td class="coverage">466<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">ng</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">74</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">312</td>
+                    <td class="coverage">388<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="keyword">for</span><span class="paren">(</span><span class="identifier">i</span> <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">75</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">313</td>
+                    <td class="coverage">1369<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="identifier">g</span> <span class="operator">=</span> <span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">76</td>
-                    <td class="coverage">427<em>x</em></td>
+                    <td class="num">314</td>
+                    <td class="coverage">1369<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="operator">!=</span><span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="identifier">assign</span><span class="paren">(</span><span class="identifier">ng</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span>, <span class="identifier">g</span>, <span class="identifier">pos</span> <span class="operator">=</span> <span class="identifier">an_env</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">77</td>
-                    <td class="coverage">427<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">315</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">play</span><span class="paren">(</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">columns</span> <span class="operator">=</span> <span class="identifier">keep</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">cmds</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">316</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">79</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">317</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">play</span><span class="paren">(</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">cmds</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">318</td>
+                    <td class="coverage">466<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">.data</span> <span class="operator">&lt;-</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">func</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span>,<span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">dotdotdot</span><span class="paren">)</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">an_env</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">319</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">320</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
+                  <tr class="covered">
+                    <td class="num">321</td>
+                    <td class="coverage">395<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">.data</span></pre>
+                    </td>
+                  </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">322</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -5353,4102 +8972,4202 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/recommend_nchunks.r" class="hidden">
+            <div id="R/one-stage-verbs.R" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Recommend number of chunks based on input size</span></pre>
+                      <pre class="language-r"><span class="comment">#' One Stage function</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description Computes the recommended number of chunks to break a data.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x the input</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' into. It can accept filesizes in bytes (as integer) or a data.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param listx a list</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame or the file size in bytes of a CSV file holding the</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param na.rm Remove NAs. TRUE of FALSE </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   data</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... additional options</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param type only = "csv" is supported. It indicates the file type</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   corresponding to file size `df`</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param minchunks the minimum number of chunks. Defaults to the number of CPU</span></pre>
+                      <pre class="language-r"><span class="identifier">var_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   cores (without hyper-threading)</span></pre>
+                      <pre class="language-r">  <span class="comment"># Guard against Github #241</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">10</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param conservatism a multiplier to the recommended number of chunks. The</span></pre>
+                      <pre class="language-r">  <span class="identifier">data.frame</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">11</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   more chunks the smaller the chunk size and more likely that each chunk can</span></pre>
+                      <pre class="language-r">    <span class="identifier">sumx</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="identifier">na.rm</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">12</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   fit into RAM</span></pre>
+                      <pre class="language-r">    <span class="identifier">sumsqrx</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">x</span><span class="operator">^</span><span class="number">2</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="identifier">na.rm</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">13</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ram_size The amount of RAM available which is usually computed. Except on RStudio with R3.6+</span></pre>
+                      <pre class="language-r">    <span class="identifier">nx</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">-</span> <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">na.rm</span>, <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span>, <span class="number">0</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom pryr object_size</span></pre>
+                      <pre class="language-r">  <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom utils memory.limit</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # recommend nchunks based on data.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' recommend_nchunks(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr bind_rows</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="identifier">var_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>  <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">21</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # recommend nchunks based on file size ONLY CSV is implemented at the moment</span></pre>
+                      <pre class="language-r">  <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">Reduce</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">bind_rows</span>, <span class="identifier">listx</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' recommend_nchunks(1024^3)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">23</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">recommend_nchunks</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span> <span class="operator">=</span> <span class="string">"csv"</span>, <span class="identifier">minchunks</span> <span class="operator">=</span> <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="identifier">logical</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">conservatism</span> <span class="operator">=</span> <span class="number">2</span>, <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">df_ram_size</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">sumlengthx</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">df</span><span class="operator">$</span><span class="identifier">nx</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">25</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r">  <span class="identifier">first_part</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">df</span><span class="operator">$</span><span class="identifier">sumsqrx</span><span class="paren">)</span> <span class="operator">/</span> <span class="identifier">sumlengthx</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">26</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">second_part</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">df</span><span class="operator">$</span><span class="identifier">sumx</span><span class="paren">)</span> <span class="operator">/</span> <span class="identifier">sumlengthx</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># the df's size in gigabytes</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">28</td>
-                    <td class="coverage">23<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">object_size</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
+                      <pre class="language-r">  <span class="comment"># unbiased adjustment</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">29</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">(</span><span class="identifier">first_part</span> <span class="operator">-</span> <span class="identifier">second_part</span><span class="operator">^</span><span class="number">2</span><span class="paren">)</span> <span class="operator">*</span> <span class="identifier">sumlengthx</span> <span class="operator">/</span> <span class="paren">(</span><span class="identifier">sumlengthx</span><span class="operator">-</span><span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">30</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">31</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">type</span> <span class="operator">==</span> <span class="string">"csv"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># assume that df is the estimated number of bytes of the data</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">33</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">df</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">sd_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">var_df.chunk_agg.disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">35</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">df</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">38</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">df_ram_size</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">sd_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>  <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">39</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="identifier">sqrt</span><span class="paren">(</span><span class="identifier">var_df.collected_agg.disk.frame</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># the number physical cores not counting hyper threaded ones as 2; they are counted as 1</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">41</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">nc</span> <span class="operator">=</span> <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="identifier">logical</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"> </pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' mean chunk_agg</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">44</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">max</span><span class="paren">(</span><span class="identifier">round</span><span class="paren">(</span><span class="identifier">dfsize</span><span class="operator">/</span><span class="identifier">ram_size</span><span class="operator">*</span><span class="identifier">nc</span><span class="paren">)</span><span class="operator">*</span><span class="identifier">nc</span><span class="operator">*</span><span class="identifier">conservatism</span>, <span class="identifier">minchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="identifier">mean_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">47</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">sumx</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="identifier">na.rm</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">48</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Get the size of RAM in gigabytes</span></pre>
+                      <pre class="language-r">  <span class="identifier">lengthx</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">-</span> <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">na.rm</span>, <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span>, <span class="number">0</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">49</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  <span class="identifier">data.frame</span><span class="paren">(</span><span class="identifier">sumx</span> <span class="operator">=</span> <span class="identifier">sumx</span>, <span class="identifier">lengthx</span> <span class="operator">=</span> <span class="identifier">lengthx</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return integer of RAM in gigabyte (GB)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom bit64 as.integer64.character</span></pre>
+                      <pre class="language-r"><span class="comment">#' mean collected_agg</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # returns the RAM size in gigabyte (GB)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df_ram_size() </span></pre>
+                      <pre class="language-r"><span class="identifier">mean_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">56</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">df_ram_size</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">x</span><span class="operator">$</span><span class="identifier">sumx</span><span class="paren">)</span><span class="paren">)</span><span class="operator">/</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">x</span><span class="operator">$</span><span class="identifier">lengthx</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">57</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># the amount of memory available in gigabytes</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">59</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">Sys.info</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="string">"sysname"</span><span class="paren">]</span><span class="paren">]</span> <span class="operator">==</span> <span class="string">"Windows"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">60</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.Platform</span><span class="operator">$</span><span class="identifier">GUI</span> <span class="operator">==</span> <span class="string">"RStudio"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">61</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">majorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">major</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">sum_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">62</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">minorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">minor</span>, <span class="string">"."</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">63</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">majorv</span><span class="operator">&gt;=</span><span class="number">3</span> <span class="operator">&amp;</span> <span class="identifier">minorv</span> <span class="operator">&gt;=</span> <span class="number">6</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">64</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">ram_size</span> <span class="operator">&lt;-</span> <span class="identifier">system</span><span class="paren">(</span><span class="string">"wmic MemoryChip get Capacity"</span>, <span class="identifier">intern</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">65</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">map</span><span class="paren">(</span><span class="operator">~</span><span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">" "</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">66</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">unlist</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">67</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">map</span><span class="paren">(</span><span class="operator">~</span><span class="identifier">bit64</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as.integer64.character</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">3</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r"><span class="identifier">sum_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">68</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">unlist</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">  <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">69</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">na.rm</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">71</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">72</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">73</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">"You are running RStudio with R 3.6+ on Windows. There is a bug with RAM size detection."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">min_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">74</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">"And disk.frame can't determine your RAM size using manual methods."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">min</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">75</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">"Going to assume your RAM size is 16GB (gigabyte). The program will continue to run."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">76</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">77</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">78</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please report a bug at https://github.com/xiaodaigh/disk.frame/issues"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">79</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">"Include this in your bug report:"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">min_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">80</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="identifier">system</span><span class="paren">(</span><span class="string">"wmic MemoryChip get Capacity"</span>, <span class="identifier">intern</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">min</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">81</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">82</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="comment">#message("The option disk.frame.ram_size is not set. </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="comment">#message("To set the ram_size, do options(disk.frame_ram_size = your_ram_size_in_gigabytes)")</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">85</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="number">16</span></pre>
+                      <pre class="language-r"><span class="identifier">max_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">86</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">max</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">90</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">memory.limit</span><span class="paren">(</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">max_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">92</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">max</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">93</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#ram_size = as.numeric(system('grep MemTotal /proc/meminfo', ignore.stdout = TRUE) / 1024)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">94</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">system</span><span class="paren">(</span><span class="string">'grep MemTotal /proc/meminfo'</span>, <span class="identifier">intern</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">95</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">a</span>, <span class="string">" "</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">96</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">l</span><span class="paren">[</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">l</span><span class="paren">)</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">97</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">2</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats median</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#ram_size = benchmarkme::get_ram()/1024/1024/1024</span></pre>
+                      <pre class="language-r"><span class="identifier">median_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">99</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> </pre>
+                      <pre class="language-r">  <span class="identifier">stats</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">median</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">100</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">101</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">102</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"RAM size not detected. Assumme you have at least 16GB of RAM"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">103</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="number">16</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">104</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">median_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">105</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># assume at least 1G of RAM</span></pre>
+                      <pre class="language-r">  <span class="identifier">stats</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">median</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">106</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ram_size</span>, <span class="number">1</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">107</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">108</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ram_size</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">109</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/shardkey.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">110</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Returns the shardkey (not implemented yet)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr n</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">111</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom jsonlite fromJSON</span></pre>
+                      <pre class="language-r"><span class="identifier">n_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">112</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">n</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">113</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">114</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">116</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># TODO make this work</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">117</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">shardkey</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">n_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">7</td>
-                    <td class="coverage">333<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">118</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">meta_file</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>,<span class="string">".metadata"</span>, <span class="string">"meta.json"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">8</td>
-                    <td class="coverage">333<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">119</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">120</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">121</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">122</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">123</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">meta_file</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">length_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">9</td>
+                    <td class="num">124</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">length</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">125</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">11</td>
-                    <td class="coverage">333<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">126</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">meta</span> <span class="operator">=</span> <span class="identifier">jsonlite</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fromJSON</span><span class="paren">(</span><span class="identifier">meta_file</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">12</td>
-                    <td class="coverage">333<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">127</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">list</span><span class="paren">(</span><span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">meta</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">meta</span><span class="operator">$</span><span class="identifier">shardchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">128</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">129</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="identifier">length_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">130</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">length</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">131</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Compare two disk.frame shardkeys</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">132</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">133</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sk1 shardkey1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">134</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sk2 shardkey2</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">135</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="identifier">any_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">136</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">any</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">137</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">shardkey_equal</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">sk1</span>, <span class="identifier">sk2</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">21</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">138</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="operator">==</span> <span class="string">""</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">139</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if the shardkey is not set then it's the same as having no shardkey</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">23</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">140</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">141</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">any_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">25</td>
+                    <td class="num">142</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="operator">==</span> <span class="identifier">sk2</span><span class="operator">$</span><span class="identifier">skardkey</span><span class="paren">)</span> <span class="operator">&amp;&amp;</span> <span class="paren">(</span><span class="identifier">sk1</span><span class="operator">$</span><span class="identifier">shardchunks</span> <span class="operator">==</span> <span class="identifier">sk2</span><span class="operator">$</span><span class="identifier">shardchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">any</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">143</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/sortablestr2i.R" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">144</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Alternative to hashstr2i that can produce semi-sorted chunks</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">145</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Apply as e.g.:</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">146</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># split_values &lt;- map(dff, sample_n, size=1) %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">147</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   select(c("id1", "id2")) %&gt;%</span></pre>
+                      <pre class="language-r"><span class="identifier">all_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">148</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   collect() %&gt;%</span></pre>
+                      <pre class="language-r">  <span class="identifier">all</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">149</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   arrange(id1, id2)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">150</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># </span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">151</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># shard_by_rule &lt;- splitstr2i(split_values)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">152</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># code = glue::glue("df[,.out.disk.frame.id := {shard_by_rule}]")</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">153</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="identifier">all_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">154</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Check if date</span></pre>
+                      <pre class="language-r">  <span class="identifier">all</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">12</td>
-                    <td class="coverage">100<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">155</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">is.date</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">inherits</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">'Date'</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">156</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">157</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Escapes names</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">158</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Factors are converted to numbers</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">159</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">escape_name</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">n_distinct_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">17</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">160</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.factor</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">na.rm</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">18</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">161</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"as.numeric("</span>, <span class="identifier">name</span>, <span class="string">")"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">setdiff</span><span class="paren">(</span><span class="identifier">unique</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="literal">NA</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">162</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">20</td>
-                    <td class="coverage">48<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">163</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">name</span></pre>
+                      <pre class="language-r">    <span class="identifier">unique</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">164</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">165</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">166</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">167</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Escapes values</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">168</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Strings and dates are quoted</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr n_distinct</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">169</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Factors are converted to number</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">170</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">escape_value</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">n_distinct_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">100<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">171</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.character</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">is.date</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">n_distinct</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">72<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">172</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"\""</span>, <span class="identifier">x</span>, <span class="string">"\""</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">28<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">173</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.factor</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">174</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">175</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">24<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">176</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">x</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats quantile</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">177</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">quantile_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">178</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">stats</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quantile</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">179</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">180</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">181</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Switch condition - returns</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">182</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># ({name} &lt; {split_value} | ({name} == {split_value} ...</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">183</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats quantile</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">184</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">switchcond</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">{</span> </pre>
+                      <pre class="language-r"><span class="identifier">quantile_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">185</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"("</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">stats</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quantile</span><span class="paren">(</span><span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">186</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="identifier">escape_name</span><span class="paren">(</span><span class="identifier">name</span>, <span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">187</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">name</span> <span class="operator">%in%</span> <span class="identifier">desc_vars</span>, <span class="string">" &lt; "</span>, <span class="string">" &gt; "</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">44</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">188</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="identifier">escape_value</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">189</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="string">" | ("</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">190</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="identifier">name</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats quantile</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">191</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="string">" == "</span>,</pre>
+                      <pre class="language-r"><span class="identifier">IQR_df.chunk_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">50<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">192</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">         <span class="identifier">escape_value</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">[</span>,<span class="identifier">name</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stats</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quantile</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">c</span><span class="paren">(</span><span class="number">0.25</span>, <span class="number">0.75</span><span class="paren">)</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="identifier">na.rm</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">193</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment">#100</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">194</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">195</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">196</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Composes the switch conditions, so each split row becomes</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">197</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># ({name1} &lt; {split_value1} | ({name1} == {split_value1} &amp; </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname one-stage-group-by-verbs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">198</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#    ({name2} &lt; {split_value2} | ({name2} == {split_value2} ...)))) * 1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats quantile</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">199</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># the sum of the split row is the id</span></pre>
+                      <pre class="language-r"><span class="identifier">IQR_df.collected_agg.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">listx</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">56</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">200</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">sortablestr2i</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">q25</span> <span class="operator">=</span> <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">c</span><span class="paren">(</span><span class="literal">TRUE</span>, <span class="literal">FALSE</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">201</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">do.call</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="identifier">q75</span> <span class="operator">=</span> <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">listx</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">c</span><span class="paren">(</span><span class="literal">FALSE</span>, <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">58</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">202</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">paste</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">quantile</span><span class="paren">(</span><span class="identifier">q75</span>, <span class="number">0.75</span><span class="paren">)</span> <span class="operator">-</span> <span class="identifier">quantile</span><span class="paren">(</span><span class="identifier">q25</span>, <span class="number">0.25</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">59</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">203</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">c</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">204</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">lapply</span><span class="paren">(</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">61</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">205</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">as.list</span><span class="paren">(</span><span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">paste</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">lapply</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">)</span>, <span class="identifier">switchcond</span>, <span class="identifier">split_values</span>, <span class="identifier">desc_vars</span><span class="paren">)</span>, <span class="identifier">sep</span><span class="operator">=</span><span class="string">" &amp; "</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">152<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">206</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"("</span>, <span class="identifier">x</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">rep</span><span class="paren">(</span><span class="string">")"</span>, <span class="identifier">ncol</span><span class="paren">(</span><span class="identifier">split_values</span><span class="paren">)</span> <span class="operator">*</span> <span class="number">2</span> <span class="operator">+</span> <span class="number">1</span><span class="paren">)</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">""</span><span class="paren">)</span>, <span class="string">"* 1"</span><span class="paren">)</span><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' A function to parse the summarize function</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">207</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter select pull</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">208</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sep</span> <span class="operator">=</span> <span class="string">" + "</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_dfr</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">209</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">210</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">211</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">summarise.grouped_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/merge.disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">212</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Merge function for disk.frames</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">213</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">214</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r">  <span class="identifier">ca_code</span> <span class="operator">=</span> <span class="identifier">generate_summ_code</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">215</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param y a disk.frame or data.frame</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">216</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param by the merge by keys</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">ca_code</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">217</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir The output directory for the disk.frame</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">".data %&gt;% {rlang::as_label(ca_code)}"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">218</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id if TRUE then only chunks in df1 and df2 with the same chunk id will get merged</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"chunk_summ_code"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ca_code</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">219</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the outdir or not</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk_summ_code</span> <span class="operator">=</span> <span class="identifier">ca_code</span><span class="operator">$</span><span class="identifier">chunk_summ_code</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">220</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to merge and map.disk.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">agg_summ_code</span> <span class="operator">=</span> <span class="identifier">ca_code</span><span class="operator">$</span><span class="identifier">agg_summ_code</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">221</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table setDT</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">222</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="comment"># get the by variables</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">223</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' b = as.disk.frame(data.frame(a = 51:150, b = 1:100))</span></pre>
+                      <pre class="language-r">    <span class="identifier">group_by_cols</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_chr</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="string">"group_by_cols"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="operator">~</span><span class="paren">{</span><span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">224</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' d = as.disk.frame(data.frame(a = 151:250, b = 1:100))</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">225</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' bd.df = merge(b, d, by = "b")</span></pre>
+                      <pre class="language-r">    <span class="comment"># generate full code</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">226</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">code_to_run</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"chunk_group_by({paste0(group_by_cols, collapse=',')}) %&gt;% chunk_summarize({chunk_summ_code}) %&gt;% collect %&gt;% group_by({paste0(group_by_cols, collapse=',')}) %&gt;% summarize({agg_summ_code})"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">227</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">228</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"summarized_disk.frame"</span>, <span class="string">"disk.frame"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">229</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="string">"summarize_code"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">code_to_run</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">230</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">231</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">232</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(b)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"something's wrong mate"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">233</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(d)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">234</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(bd.df)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">235</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">merge.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span>  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">21</td>
-                    <td class="coverage">3<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">3<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">236</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#fs::dir_create(outdir)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">237</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">3<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">238</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">summarize.grouped_disk.frame</span> <span class="operator">=</span> <span class="identifier">summarise.grouped_disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">239</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">yby</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">y</span><span class="operator">=</span><span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="identifier">by</span><span class="paren">)</span>, <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">27</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">240</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Group by within each disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">241</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">merge</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">yby</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">242</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span></pre>
+                      <pre class="language-r"><span class="comment">#' The disk.frame group by operation perform group WITHIN each chunk. This is</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">243</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' often used for performance reasons. If the user wishes to perform group-by,</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">244</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span>  </pre>
+                      <pre class="language-r"><span class="comment">#' they may choose to use the `hard_group_by` function which is expensive as it</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">245</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">|</span> <span class="identifier">shardkey_equal</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' reorganizes the chunks by the shard key.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">246</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># ifthe shardkeys are the same then only need to match by segment id</span></pre>
+                      <pre class="language-r"><span class="comment">#' @seealso hard_group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">247</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># as account with the same shardkey must end up in the same segment</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .data a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">248</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">path1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param add from dplyr</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">36</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">249</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">y</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .drop from dplyr</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">250</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @param ... same as the dplyr::group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">251</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df3</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_drop_default</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">252</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">253</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">254</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pathA</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment"># learning from https://docs.dask.org/en/latest/dataframe-groupby.html</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">255</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="identifier">group_by.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_drop_default</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">43</td>
+                    <td class="num">256</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"grouped_disk.frame"</span>, <span class="string">"disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">44</td>
+                    <td class="num">257</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="string">"group_by_cols"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">substitute</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span><span class="paren">[</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">45</td>
+                    <td class="num">258</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pathB</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">.data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">259</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">260</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">261</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df3</span><span class="paren">[</span>,<span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">50</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">262</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data1</span> <span class="operator">=</span> <span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">pathA</span>,<span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">51</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">263</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data2</span> <span class="operator">=</span> <span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">pathB</span>,<span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">52</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">264</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data3</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">merge</span><span class="paren">(</span><span class="identifier">data1</span>, <span class="identifier">data2</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">summarize.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">53</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">265</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span>; <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">ca_code</span> <span class="operator">=</span> <span class="identifier">generate_summ_code</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">54</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">266</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data3</span>, <span class="identifier">glue</span><span class="paren">(</span><span class="string">"{outdir}/{.BY}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">55</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">267</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">ca_code</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">56</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">268</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">chunk_id</span><span class="paren">]</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">".data %&gt;% {rlang::as_label(ca_code)}"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">269</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"chunk_summ_code"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ca_code</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">58</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">270</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk_summ_code</span> <span class="operator">=</span> <span class="identifier">ca_code</span><span class="operator">$</span><span class="identifier">chunk_summ_code</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">59</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">271</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"Cartesian joins are currently not implemented. Either make y a data.frame or set merge_by_chunk_id to TRUE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">agg_summ_code</span> <span class="operator">=</span> <span class="identifier">ca_code</span><span class="operator">$</span><span class="identifier">agg_summ_code</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">272</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">273</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># have to make every possible combination</span></pre>
+                      <pre class="language-r">    <span class="comment"># generate full code</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">62</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">274</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># path1 = attr(df1,"path")</span></pre>
+                      <pre class="language-r">    <span class="identifier">code_to_run</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"chunk_summarize({chunk_summ_code}) %&gt;% collect %&gt;% summarize({agg_summ_code})"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">275</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># path2 = attr(df2,"path")</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">64</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">276</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># </span></pre>
+                      <pre class="language-r">    <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"summarized_disk.frame"</span>, <span class="string">"disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">65</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">277</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># df3 = merge(</span></pre>
+                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="string">"summarize_code"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">code_to_run</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">66</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">278</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   data.table(</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.data</span> <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">279</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     justmerge = TRUE,</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">68</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">280</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     chunk_id1 = list.files(path1), </span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"something's wrong"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">281</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     pathA = list.files(path1,full.names = TRUE)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">282</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   ),</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">283</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   data.table(</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">72</td>
+                    <td class="num">284</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     justmerge = TRUE,</span></pre>
+                      <pre class="language-r"><span class="comment">#' Helper function to generate summarisation code</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">285</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     chunk_id2 = list.files(path2), </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table setDT setkey</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">286</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     pathB = list.files(path2,full.names = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom utils methods</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">287</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   ),</span></pre>
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">288</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   by = "justmerge",</span></pre>
+                      <pre class="language-r"><span class="identifier">generate_summ_code</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">289</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   all=TRUE,</span></pre>
+                      <pre class="language-r">  <span class="comment"># expand the code</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">78</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">290</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   allow.cartesian = TRUE</span></pre>
+                      <pre class="language-r">  <span class="identifier">code_to_expand</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"quo(summarise({rlang::as_label(substitute(...))}))"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">291</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># )</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">80</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">292</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># </span></pre>
+                      <pre class="language-r">  <span class="identifier">summ_code_quosure</span> <span class="operator">=</span> <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">code_to_expand</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">293</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># </span></pre>
+                      <pre class="language-r">  <span class="comment">#print(summ_code_quosure)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">294</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># setDT(df3)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">83</td>
+                    <td class="num">295</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># i &lt;- 0</span></pre>
+                      <pre class="language-r">  <span class="comment"># ZJ: </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">296</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># mapply(function(pathA, pathB) {</span></pre>
+                      <pre class="language-r">  <span class="comment"># try the traditional route which can't deal with !!!, so if this fails then try the !!! route</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">85</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">297</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   stop("error")</span></pre>
+                      <pre class="language-r">  <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">86</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">298</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   data1 = read_fst(pathA,as.data.table = TRUE, columns = c("ACCOUNT_ID","MONTH_KEY"))</span></pre>
+                      <pre class="language-r">    <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">substitute</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span><span class="paren">[</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">87</td>
+                    <td class="num">299</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   data2 = read_fst(pathB,as.data.table = TRUE, columns = c("ACCOUNT_ID","MONTH_KEY"))</span></pre>
+                      <pre class="language-r">    <span class="comment"># print("hehe")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">88</td>
+                    <td class="num">300</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   data3 = merge(data1, data2, ...)</span></pre>
+                      <pre class="language-r">    <span class="comment"># print(code)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">89</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">301</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   rm(data1); rm(data2); gc()</span></pre>
+                      <pre class="language-r">    <span class="identifier">expr_id</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">90</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">302</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   if(nrow(data3) &gt; 0) {</span></pre>
+                      <pre class="language-r">    <span class="identifier">temp_varn</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">91</td>
+                    <td class="num">303</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     i &lt;&lt;- i + 1</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">92</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">304</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#     write_fst(data3, glue("{outdir}/{i}.fst"))</span></pre>
+                      <pre class="language-r">    <span class="identifier">list_of_chunk_agg_fns</span> <span class="operator">&lt;-</span> <span class="identifier">as.character</span><span class="paren">(</span><span class="identifier">utils</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">methods</span><span class="paren">(</span><span class="identifier">class</span> <span class="operator">=</span> <span class="string">"chunk_agg.disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">93</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">305</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   }</span></pre>
+                      <pre class="language-r">    <span class="identifier">list_of_collected_agg_fns</span> <span class="operator">&lt;-</span> <span class="identifier">as.character</span><span class="paren">(</span><span class="identifier">utils</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">methods</span><span class="paren">(</span><span class="identifier">class</span> <span class="operator">=</span> <span class="string">"collected_agg.disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">306</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   NULL</span></pre>
+                      <pre class="language-r">    <span class="comment"># browser()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">95</td>
+                    <td class="num">307</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># },df3$pathA, df3$pathB)</span></pre>
+                      <pre class="language-r">    <span class="comment"># generate the chunk_summarize_code</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">96</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">308</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># return(disk.frame(outdir))</span></pre>
+                      <pre class="language-r">    <span class="identifier">summarize_code</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">code</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">97</td>
+                    <td class="num">309</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment"># print("raw code")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">98</td>
+                    <td class="num">310</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment"># print(.x)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/map.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">311</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Apply the same function to all chunks</span></pre>
+                      <pre class="language-r">      <span class="identifier">expr_id</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">expr_id</span>  <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">312</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .x a disk.frame</span></pre>
+                      <pre class="language-r">      <span class="comment"># parse the function into table form for easy interrogration</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">313</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .f a function to apply to each of the chunks</span></pre>
+                      <pre class="language-r">      <span class="comment"># The keep.source = TRUE options seems necessary to keep it working in Rscript mode</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">314</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r">      <span class="identifier">gpd</span> <span class="operator">=</span> <span class="identifier">getParseData</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">keep.source</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">includeText</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>; </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">315</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param keep the columns to keep from the input</span></pre>
+                      <pre class="language-r">      <span class="comment"># print("raw table")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">316</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunks The number of chunks to output</span></pre>
+                      <pre class="language-r">      <span class="comment"># print(deparse(.x))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">317</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param lazy if TRUE then do this lazily</span></pre>
+                      <pre class="language-r">      <span class="comment"># print(gpd)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">318</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress 0-100 fst compression ratio</span></pre>
+                      <pre class="language-r">      <span class="identifier">grp_funcs</span> <span class="operator">=</span> <span class="identifier">gpd</span> <span class="operator">%&gt;%</span> <span class="identifier">filter</span><span class="paren">(</span><span class="identifier">token</span> <span class="operator">==</span> <span class="string">"SYMBOL_FUNCTION_CALL"</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">select</span><span class="paren">(</span><span class="identifier">text</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">pull</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">319</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite if TRUE removes any existing chunks in the data</span></pre>
+                      <pre class="language-r">      <span class="identifier">grp_funcs</span> <span class="operator">=</span> <span class="identifier">grp_funcs</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"_df"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">320</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param use.names for map_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">321</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param fill for map_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
+                      <pre class="language-r">      <span class="comment"># search in the space to find functions name `fn`.chunk_agg.disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">322</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param idcol for map_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
+                      <pre class="language-r">      <span class="comment"># only allow one such functions for now TODO improve it</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">323</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param vars_and_pkgs variables and packages to send to a background session. This is typically automatically detected</span></pre>
+                      <pre class="language-r">      <span class="identifier">num_of_chunk_functions</span> <span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">unique</span><span class="paren">(</span><span class="identifier">grp_funcs</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">exists</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">".chunk_agg.disk.frame"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">324</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
+                      <pre class="language-r">      <span class="identifier">num_of_collected_functions</span><span class="operator">=</span> <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">unique</span><span class="paren">(</span><span class="identifier">grp_funcs</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">exists</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">".collected_agg.disk.frame"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">325</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... for compatibility with `purrr::map`</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">326</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
+                      <pre class="language-r">      <span class="comment"># the number chunk and aggregation functions must match</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">327</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr as_mapper map</span></pre>
+                      <pre class="language-r">      <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">num_of_chunk_functions</span> <span class="operator">==</span> <span class="identifier">num_of_collected_functions</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">328</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">329</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="comment"># keep only grp_functions</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">330</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="identifier">grp_funcs</span><span class="operator">=</span> <span class="identifier">grp_funcs</span><span class="paren">[</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">grp_funcs</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="identifier">exists</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">".chunk_agg.disk.frame"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">331</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">22</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">332</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">num_of_chunk_functions</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">333</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk lazily</span></pre>
+                      <pre class="language-r">        <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"There must be at least one summarization function in %s"</span>, <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">334</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # </span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">num_of_chunk_functions</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">335</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2 = map(cars.df, function(chunk) {</span></pre>
+                      <pre class="language-r">        <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Two or more summarisation functions are detected in \n\n```\n%s\n```\n\nThese are currently not supported by {disk.frame} at the moment \n    * Nestling (like mean(sum(x) + y)) or \n    * combinations (like sum(x) + mean(x))\n\nIf you want this implemented, please leave a comment or upvote at: https://github.com/xiaodaigh/disk.frame/issues/228 \n\n"</span>, <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">336</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'  chunk[,1]</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">337</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' })</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">338</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="comment"># check to see if the mean is only two from parent 0, otherwise it would a statement in the form of 1 + mean(x)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">339</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(cars2)</span></pre>
+                      <pre class="language-r">      <span class="comment"># which isn't supported</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">30</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">340</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">gpd</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">31</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">341</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # same as above but using purrr </span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setkey</span><span class="paren">(</span><span class="identifier">gpd</span>, <span class="identifier">parent</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">32</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">342</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2 = map(cars.df, ~.x[1,])</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">gpd</span><span class="paren">[</span><span class="identifier">id</span> <span class="operator">==</span> <span class="identifier">gpd</span><span class="paren">[</span><span class="identifier">id</span> <span class="operator">==</span> <span class="identifier">gpd</span><span class="paren">[</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">text</span>,<span class="string">"_df"</span><span class="paren">)</span> <span class="operator">==</span> <span class="identifier">grp_funcs</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="paren">(</span><span class="identifier">token</span> <span class="operator">==</span> <span class="string">"SYMBOL_FUNCTION_CALL"</span><span class="paren">)</span>, <span class="identifier">parent</span><span class="paren">]</span>, <span class="identifier">parent</span><span class="paren">]</span>, <span class="identifier">parent</span><span class="paren">]</span> <span class="operator">!=</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">33</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">343</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Combining summarization with other operations \n\n```\n%s\n```\n\nThese are currently not supported by {disk.frame} at the moment \n    * combinations (like sum(x) + 1)\n* combinations (like list(sum(x)))\n\nIf you want this implemented, please leave a comment or upvote at: https://github.com/xiaodaigh/disk.frame/issues/228 \n\n"</span>, <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">344</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(cars2)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">345</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">36</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">346</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk eagerly as list</span></pre>
+                      <pre class="language-r">      <span class="identifier">temp_varn</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">temp_varn</span> <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">37</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">347</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' map(cars.df, ~.x[1,], lazy = FALSE)</span></pre>
+                      <pre class="language-r">      <span class="identifier">grp_funcs_wo_df</span> <span class="operator">=</span> <span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">grp_funcs</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">grp_func</span><span class="paren">)</span> <span class="identifier">substr</span><span class="paren">(</span><span class="identifier">grp_func</span>, <span class="number">1</span>, <span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">grp_func</span><span class="paren">)</span><span class="operator">-</span><span class="number">3</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">348</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">39</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">349</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk eagerly as data.table/data.frame by row-binding</span></pre>
+                      <pre class="language-r">      <span class="identifier">tmpcode</span> <span class="operator">=</span> <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">evalparseglue</span><span class="paren">(</span><span class="string">"substitute({deparse(.x)}, list({grp_funcs_wo_df} = quote({grp_funcs}.chunk_agg.disk.frame)))"</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">" "</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">350</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' map_dfr(cars.df, ~.x[1,])</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">41</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">351</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span> <span class="operator">=</span> <span class="identifier">data.frame</span><span class="paren">(</span><span class="identifier">assign_to</span> <span class="operator">=</span> <span class="identifier">as.character</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"tmp{temp_varn}"</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">expr</span> <span class="operator">=</span> <span class="identifier">tmpcode</span>, <span class="identifier">stringsAsFactors</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">352</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # lazy and delayed are just an aliases for map(..., lazy = TRUE)</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">43</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">353</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(lazy(cars.df, ~.x[1,]))</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span><span class="operator">$</span><span class="identifier">orig_code</span> <span class="operator">=</span> <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">44</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">354</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(delayed(cars.df, ~.x[1,]))</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span><span class="operator">$</span><span class="identifier">expr_id</span> <span class="operator">=</span> <span class="identifier">expr_id</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">45</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">355</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span><span class="operator">$</span><span class="identifier">grp_fn</span> <span class="operator">=</span> <span class="identifier">grp_funcs</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">46</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">356</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span><span class="operator">$</span><span class="identifier">name</span> <span class="operator">=</span> <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">[</span><span class="identifier">expr_id</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span>, <span class="string">""</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">[</span><span class="identifier">expr_id</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">357</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">358</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment"># create the aggregation code</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">163<em>x</em></td>
+                    <td class="num">359</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_code</span><span class="operator">$</span><span class="identifier">agg_expr</span> <span class="operator">=</span> <span class="identifier">as.character</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{grp_funcs}.collected_agg.disk.frame({paste0(chunk_code$assign_to, collapse=', ')})"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">360</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">361</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment">#print(sapply(chunk_code, typeof))</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">362</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">chunk_code</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">363</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">364</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">54</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">365</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk_summ_code</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">summarize_code</span><span class="operator">$</span><span class="identifier">assign_to</span>, <span class="string">"=list("</span>, <span class="identifier">summarize_code</span><span class="operator">$</span><span class="identifier">expr</span>, <span class="string">")"</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">", "</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">366</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">56</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">367</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">agg_code_df</span> <span class="operator">=</span> <span class="identifier">summarize_code</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">57</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">368</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">      <span class="identifier">select</span><span class="paren">(</span><span class="identifier">expr_id</span>, <span class="identifier">name</span>, <span class="identifier">agg_expr</span>, <span class="identifier">orig_code</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">58</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">369</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future getGlobalsAndPackages</span></pre>
+                      <pre class="language-r">      <span class="identifier">unique</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">59</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">370</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="identifier">transmute</span><span class="paren">(</span><span class="identifier">agg_code</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">name</span> <span class="operator">==</span> <span class="string">""</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"`"</span>, <span class="identifier">orig_code</span>, <span class="string">"` = "</span><span class="paren">)</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">name</span>, <span class="string">"="</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">agg_expr</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">371</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">chunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getGlobalsAndPackages</span><span class="paren">(</span><span class="identifier">.f</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">parent.frame</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">61</td>
-                    <td class="coverage">187<em>x</em></td>
+                    <td class="num">372</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">agg_summ_code</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">agg_code_df</span><span class="operator">$</span><span class="identifier">agg_code</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">","</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">187<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">373</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">lazy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">63</td>
-                    <td class="coverage">111<em>x</em></td>
+                    <td class="num">374</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">=</span> </pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">chunk_summ_code</span> <span class="operator">=</span> <span class="identifier">chunk_summ_code</span>, <span class="identifier">agg_summ_code</span> <span class="operator">=</span> <span class="identifier">agg_summ_code</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">111<em>x</em></td>
+                    <td class="num">375</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">c</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">376</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">summ_code_quosure</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">66</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">377</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">list</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">67</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">378</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">list</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">68</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">379</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">func</span> <span class="operator">=</span> <span class="identifier">.f</span>, </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">380</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">vars_and_pkgs</span>, </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">70</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">381</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">382</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">72</td>
+                    <td class="num">383</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">384</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">74</td>
-                    <td class="coverage">111<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">385</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">summarise.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">summarize.disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">386</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">387</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">77</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">388</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">78</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">389</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">390</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/rechunk.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' Increase or decrease the number of chunks in the disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">81</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df the disk.frame to rechunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">83</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"keep"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby the shardkeys</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">85</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the output directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">86</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">87</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">88</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">89</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">90</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">91</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files_shortname</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # create a disk.frame with 2 chunks in tempdir()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">92</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">93</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' # re-chunking cars.df to 3 chunks, done "in-place" to the same folder as cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">95</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' rechunk(cars.df, 3)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">96</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">97</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' new_path = tempfile(fileext = ".df")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">98</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' # re-chunking cars.df to 4 chunks, shard by speed, and done "out-of-place" to a new directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">99</td>
-                    <td class="coverage">76<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">ii</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2.df = rechunk(cars.df, 4, outdir=new_path, shardby = "speed")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">100</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#res = lapply(1:length(files), function(ii) {</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">101</td>
-                    <td class="coverage">344<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ds</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">cid</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span>, <span class="identifier">keep</span><span class="operator">=</span><span class="identifier">keep_future</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">102</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">103</td>
-                    <td class="coverage">344<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">ds</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">rechunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">104</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">105</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#res = do.call(.f, c(ds, dotdotdot))</span></pre>
+                      <pre class="language-r">  <span class="comment"># we need to force the chunks to be computed first as it's common to make nchunks a multiple of chunks(df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">106</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="comment"># but if we do it too late then the folder could be empty</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">107</td>
-                    <td class="coverage">344<em>x</em></td>
+                    <td class="num">29</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span> </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">30</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">108</td>
-                    <td class="coverage">23<em>x</em></td>
+                    <td class="num">31</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">&lt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">109</td>
+                    <td class="num">32</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The output chunk has 0 row, therefore chunk {ii} NOT written"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nchunks must be larger than 1"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">110</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">111</td>
-                    <td class="coverage">23<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">files_shortname</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span><span class="paren">)</span>, <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">112</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">113</td>
-                    <td class="coverage">23<em>x</em></td>
+                    <td class="num">35</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">114</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">115</td>
-                    <td class="coverage">321<em>x</em></td>
+                    <td class="num">37</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">user_had_not_set_shard_by</span> <span class="operator">=</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">116</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">user_had_set_shard_by</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">user_had_not_set_shard_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">117</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">118</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="comment"># back up the files if writing to the same directory</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">119</td>
-                    <td class="coverage">76<em>x</em></td>
+                    <td class="num">41</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">outdir</span> <span class="operator">==</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">120</td>
+                    <td class="num">42</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">back_up_tmp_dir</span> <span class="operator">&lt;-</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"back_up_tmp_dir"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">121</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">122</td>
-                    <td class="coverage">72<em>x</em></td>
+                    <td class="num">45</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_copy</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">123</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span>, <span class="comment">#from</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">124</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span>, <span class="string">".metadata"</span><span class="paren">)</span> <span class="comment">#to</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">125</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">126</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">127</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">    <span class="comment"># back-up the files first</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">128</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .id not used</span></pre>
+                      <pre class="language-r">    <span class="identifier">full_files</span> <span class="operator">=</span> <span class="identifier">dir</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">short_files</span> <span class="operator">=</span> <span class="identifier">dir</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">129</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">130</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment"># move all files to the back up folder</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">131</td>
-                    <td class="coverage">18<em>x</em></td>
+                    <td class="num">55</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map_dfr"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">full_files</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">56</td>
+                    <td class="coverage">20<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">132</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">133</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">134</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">135</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">136</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map_dfr.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment"># TODO check for validity</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">137</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="identifier">.id</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"files have been backed up to temporary dir {back_up_tmp_dir}. You can recover there files until you restart your R session"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">138</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">139</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">66</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">back_up_tmp_dir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">140</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">141</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">142</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">143</td>
-                    <td class="coverage">18<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">144</td>
-                    <td class="coverage">!</td>
+                    <td class="num">71</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">".id is not NULL, but the parameter is not used with map_dfr.disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">dfp</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">145</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">72</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">existing_shardkey</span> <span class="operator">=</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">146</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">147</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># TODO warn the user if outdir is map_dfr</span></pre>
+                      <pre class="language-r">  <span class="comment"># by default, if shardkey is defined then rechunk will continue to reuse it</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">148</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">75</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">149</td>
-                    <td class="coverage">18<em>x</em></td>
+                    <td class="num">76</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">existing_shardkey</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">150</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">151</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">152</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">153</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">80</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">user_had_set_shard_by</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">154</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">81</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">155</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">82</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardby</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">156</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="comment"># if no existing shardby </span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">157</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">84</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="identifier">nr</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">158</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">85</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # .x is the chunk and .y is the ID as an integer</span></pre>
+                      <pre class="language-r">    <span class="identifier">nr_per_chunk</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nr</span><span class="operator">/</span><span class="identifier">nchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">159</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">86</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">160</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">87</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # lazy = TRUE support is not available at the moment</span></pre>
+                      <pre class="language-r">    <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">161</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">88</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' imap(cars.df, ~.x[, id := .y], lazy = FALSE)</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunks_read</span> <span class="operator">=</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">162</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">89</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">163</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">90</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">91</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' imap_dfr(cars.df, ~.x[, id := .y])</span></pre>
+                      <pre class="language-r">    <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">164</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">92</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">165</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">93</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">    <span class="keyword">while</span><span class="paren">(</span><span class="identifier">chunks_read</span> <span class="operator">&lt;</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">166</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">94</td>
+                    <td class="coverage">30<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">nr_per_chunk</span> <span class="operator">&lt;=</span> <span class="identifier">used_so_far</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">167</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">95</td>
+                    <td class="coverage">14<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">        <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">a</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nr_per_chunk</span>,<span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">168</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">96</td>
+                    <td class="coverage">14<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="identifier">chunks_written</span> <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">169</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">97</td>
+                    <td class="coverage">14<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"imap"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">a</span><span class="paren">[</span><span class="operator">-</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nr_per_chunk</span><span class="paren">)</span>,<span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">170</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">98</td>
+                    <td class="coverage">14<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">171</td>
+                    <td class="num">99</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">172</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">100</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunks_read</span> <span class="operator">=</span> <span class="identifier">chunks_read</span> <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">173</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">101</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">        <span class="identifier">newa</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunks_read</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">174</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">102</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">used_so_far</span> <span class="operator">=</span> <span class="identifier">used_so_far</span> <span class="operator">+</span> <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">newa</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">175</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">103</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">a</span>, <span class="identifier">newa</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">176</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">104</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">newa</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">177</td>
+                    <td class="num">105</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">178</td>
+                    <td class="num">106</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' `imap.disk.frame` accepts a two argument function where the first argument is a data.frame and the </span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">179</td>
+                    <td class="num">107</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' second is the chunk ID</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">180</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">108</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">while</span><span class="paren">(</span><span class="identifier">chunks_written</span> <span class="operator">&lt;</span> <span class="identifier">nchunks</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">109</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="identifier">rows_to_write</span> <span class="operator">=</span> <span class="identifier">min</span><span class="paren">(</span><span class="identifier">nr_per_chunk</span>, <span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">181</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">110</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">a</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">rows_to_write</span>,<span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">182</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">111</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">chunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">a</span><span class="paren">[</span><span class="operator">-</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">rows_to_write</span><span class="paren">)</span>,<span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">183</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">112</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunks_written</span> <span class="operator">=</span> <span class="identifier">chunks_written</span> <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">184</td>
+                    <td class="num">113</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">185</td>
+                    <td class="num">114</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># TODO support lazy for imap</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">186</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">115</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">lazy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">187</td>
+                    <td class="num">116</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"imap.disk.frame: lazy = TRUE is not supported at this stage"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># if there is existing shard by; shardby has been replaced with new shard by</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">188</td>
+                    <td class="num">117</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span>, <span class="identifier">.f</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">user_had_not_set_shard_by</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">189</td>
+                    <td class="num">118</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"shardby = NULL; but there are already shardkey's defined for this disk.frame. Therefore a rechunk algorithm that preserves the shardkey's has been applied and this algorithm is slower than an algorithm that doesn't use a shardkey."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">190</td>
+                    <td class="num">119</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">191</td>
+                    <td class="num">120</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">192</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">121</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment"># using some maths we can cut down on the number of operations</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">193</td>
+                    <td class="num">122</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">nc</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">194</td>
+                    <td class="num">123</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">195</td>
+                    <td class="num">124</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="comment"># TODO there is bug here! If the chunks are in numbers form!</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">196</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">125</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># if the number of possible new chunk ids is one then no need to perform anything. just merge those</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">197</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">126</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="identifier">possibles_new_chunk_id</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nc</span>, <span class="operator">~</span><span class="identifier">unique</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">.x</span><span class="operator">-</span><span class="number">1</span> <span class="operator">+</span> <span class="paren">(</span><span class="number">0</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="operator">-</span><span class="number">1</span><span class="paren">)</span><span class="paren">)</span><span class="operator">*</span><span class="identifier">nc</span><span class="paren">)</span> <span class="operator">%%</span> <span class="identifier">nchunks</span><span class="paren">)</span><span class="operator">+</span><span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">198</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">127</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"keep"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">lp</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_int</span><span class="paren">(</span><span class="identifier">possibles_new_chunk_id</span>,<span class="identifier">length</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">199</td>
+                    <td class="num">128</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">200</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">129</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment">#need to shards</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">201</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">130</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
+                      <pre class="language-r">    <span class="identifier">nts</span> <span class="operator">=</span> <span class="identifier">which</span><span class="paren">(</span><span class="identifier">lp</span> <span class="operator">!=</span> <span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">202</td>
+                    <td class="num">131</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">203</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">132</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="identifier">bad_boys</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">nts</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">204</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">133</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">df1</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">205</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">134</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">206</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">135</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files_shortname</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">207</td>
+                    <td class="num">136</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">208</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">137</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">keep_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
+                      <pre class="language-r">    <span class="comment"># for those that don't need to be resharded</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">209</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">138</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp_fdlr</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"rechunk_shard"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">210</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">139</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ds</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">ii</span>, <span class="identifier">keep</span><span class="operator">=</span><span class="identifier">keep_future</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">211</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">140</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">ds</span>, <span class="identifier">ii</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">212</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">141</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">oks</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="identifier">which</span><span class="paren">(</span><span class="identifier">lp</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">213</td>
+                    <td class="num">142</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">files_shortname</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span><span class="paren">)</span>, <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">file_chunk</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">i</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">214</td>
+                    <td class="num">143</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">file_chunk</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span>, <span class="identifier">possibles_new_chunk_id</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span> <span class="operator">%&gt;%</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">215</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">144</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">tmp_fdlr</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">216</td>
-                    <td class="coverage">5<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">145</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">217</td>
+                    <td class="num">146</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">218</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">147</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">list_of_sharded</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">bad_boys</span>, <span class="identifier">oks</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">148</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">new_one</span> <span class="operator">&lt;-</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">list_of_sharded</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">219</td>
+                    <td class="num">149</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">220</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">150</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">new_one</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">new_one</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">221</td>
+                    <td class="num">151</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">222</td>
+                    <td class="num">152</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">223</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">153</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"rechunk: option not supported"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">224</td>
+                    <td class="num">154</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">225</td>
+                    <td class="num">155</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/full_join.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">226</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">227</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">228</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">229</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">230</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">231</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">".id is not NULL, but the parameter is not used with map_dfr.disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">232</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">233</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">imap.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">234</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' join.df = full_join(cars.df, cars.df, merge_by_chunk_id = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">235</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">236</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">237</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">238</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">239</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">full_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_full_join"</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">merge_by_chunk_id</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">240</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">12</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"imap_dfr"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">241</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">242</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">14</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">243</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">244</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">245</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">17</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">246</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">imap_dfr.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment"># full join cannot be support for y in data.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">247</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">19</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap_dfr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="identifier">.id</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">248</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">20</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">dy</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">ncx</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">249</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">21</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">dx</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">250</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">22</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">full_join.disk.frame</span><span class="paren">(</span><span class="identifier">dx</span>, <span class="identifier">dy</span>, <span class="identifier">by</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="identifier">copy</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">251</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">23</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' `lazy` is convenience function to apply `.f` to every chunk</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">252</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">24</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">253</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">25</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">254</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">lazy</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">255</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">27</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"lazy"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">256</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">28</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">257</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">258</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">259</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">260</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">lazy.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">261</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">262</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">263</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">264</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' `delayed` is an alias for lazy and is consistent with the naming in Dask and Dagger.jl</span></pre>
+                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">265</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">full_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">266</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">267</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">delayed</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap2</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">268</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">40</td>
+                    <td class="coverage">37<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"delayed"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">269</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">270</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">42</td>
+                    <td class="coverage">37<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">271</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">272</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">273</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">45</td>
+                    <td class="coverage">37<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">delayed.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">full_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">274</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">46</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">275</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">276</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">277</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">278</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">50</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">279</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_lapply</span> <span class="operator">&lt;-</span> <span class="keyword">function</span> <span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">280</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"chunk_lapply is deprecated in favour of map.disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">281</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">52</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">282</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -9457,42 +13176,42 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/sample_frac.R" class="hidden">
+            <div id="R/semi_join.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Sample n rows from a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param y a data.frame or disk.frame. If data.frame then returns lazily; if disk.frame it performs the join eagerly and return a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr sample_frac</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir output directory for disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @inheritParams dplyr::sample_frac</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname join </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname sample</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -9520,7 +13239,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(sample_frac(cars.df, 0.5))</span></pre>
+                      <pre class="language-r"><span class="comment">#' join.df = semi_join(cars.df, cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -9548,6159 +13267,6108 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">sample_frac.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">tbl</span>, <span class="identifier">size</span><span class="operator">=</span><span class="number">1</span>, <span class="identifier">replace</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">weight</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">.env</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">2<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="identifier">semi_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_semi_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">15</td>
-                    <td class="coverage">2<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">weight</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"sample_frac: for disk.frames weight = is not supported"</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">17</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">18</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.env</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">19</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"sample_frac: for disk.frames .env = is not supported"</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">20</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">21</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">cmap_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">semi_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">23</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fn</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sample_frac</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">24</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fn</span><span class="paren">(</span><span class="identifier">tbl</span>, <span class="identifier">size</span> <span class="operator">=</span> <span class="identifier">size</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="identifier">replace</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">27</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"></pre>
-                    </td>
-                  </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/foverlaps.disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Apply data.table's foverlaps to the disk.frame</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description EXPERIMENTAL</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df1 A disk.frame</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df2 A disk.frame or a data.frame</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param by.x character/string vector. by.x used in foverlaps</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param by.y character/string vector. by.x used in foverlaps</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir The output directory of the disk.frame</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id If TRUE then the merges will happen for chunks in df1 and df2 with the same chunk id which speed up processing. Otherwise every chunk of df1 is merged with every chunk of df2. Ignored with df2 is not a disk.frame</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">29</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress The compression ratio for fst</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">30</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite existing directory</span></pre>
+                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to data.table::foverlaps and disk.frame::map.disk.frame</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table foverlaps data.table setDT setkeyv</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">18</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">19</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' library(data.table)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">semi_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">40</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">21</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' ## simple example:</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">22</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">42</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' x = as.disk.frame(data.table(start=c(5,31,22,16), end=c(8,50,25,18), val2 = 7:10))</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' y = as.disk.frame(data.table(start=c(10, 20, 30), end=c(15, 35, 45), val1 = 1:3))</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">44</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' xy.df = foverlaps.disk.frame(</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">45</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   x, </span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   y, </span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">27</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   by.x = c("val1", "start", "end"), </span></pre>
+                      <pre class="language-r">        <span class="identifier">semi_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="keyword">...</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">28</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   by.y = c("val1", "start", "end"), </span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">29</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   merge_by_chunk_id = TRUE, </span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   overwrite = TRUE)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">32</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">52</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(x)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(y)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(xy.df)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/cmap.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">foverlaps.disk.frame</span> <span class="operator">&lt;-</span></pre>
+                      <pre class="language-r"><span class="comment">#' Apply the same function to all chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">function</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df1</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param .f a function to apply to each of the chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df2</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">by.x</span> <span class="operator">=</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="keyword">else</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param keep the columns to keep from the input</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">by.y</span> <span class="operator">=</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param chunks The number of chunks to output</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">...</span>, </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">outdir</span> <span class="operator">=</span> <span class="paren">{</span><span class="keyword">warning</span><span class="paren">(</span><span class="string">"temp dir create"</span><span class="paren">)</span>; <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"df_foverlaps_tmp"</span>, <span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span><span class="paren">}</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param lazy if TRUE then do this lazily</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress 0-100 fst compression ratio</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite if TRUE removes any existing chunks in the data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">48</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param use.names for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">50</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">51</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="operator">~</span><span class="identifier">foverlaps</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">df2</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param fill for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">|</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param idcol for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if the shardkeys are the same then only need to match by segment id</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param vars_and_pkgs variables and packages to send to a background session. This is typically automatically detected</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># as account with the same shardkey must end up in the same segment</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">path1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df1</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... for compatibility with `purrr::map`</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">56</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df2</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr as_mapper map</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">58</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df3</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">59</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">60</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">61</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pathA</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">62</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">file_id</span> <span class="operator">=</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk lazily</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">64</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' # </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">65</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' cars2 = cmap(cars.df, function(chunk) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">66</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pathB</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'  chunk[,1]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' })</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">68</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">28</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"chunk_id"</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">70</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">30</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' # same as above but using purrr </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">72</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">32</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2 = cmap(cars.df, ~.x[1,])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">74</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">row</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars2)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#future.apply::future_lapply(1:nrow(df3), function(row) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#lapply(1:nrow(df3), function(row) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk eagerly as list</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">77</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">df3</span><span class="paren">[</span><span class="identifier">row</span>, <span class="identifier">chunk_id</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' cmap(cars.df, ~.x[1,], lazy = FALSE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">79</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data1</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # return the first row of each chunk eagerly as data.table/data.frame by row-binding</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">80</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data2</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df2</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cmap_dfr(cars.df, ~.x[1,])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">82</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">42</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # lazy and delayed are just an aliases for cmap(..., lazy = TRUE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">83</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(lazy(cars.df, ~.x[1,]))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' collect(delayed(cars.df, ~.x[1,]))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">85</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">setkeyv</span><span class="paren">(</span><span class="identifier">data2</span>, <span class="identifier">by.y</span><span class="paren">[</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by.y</span><span class="paren">)</span><span class="operator">-</span><span class="number">2</span><span class="operator">+</span><span class="number">1</span><span class="paren">)</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by.y</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">86</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">87</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dotdotdot</span><span class="operator">$</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">data1</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">88</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">48</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dotdotdot</span><span class="operator">$</span><span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">data2</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">89</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">151<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data3</span> <span class="operator">=</span> <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">foverlaps</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"cmap"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">90</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span>; <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">91</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">51</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">outdir</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">92</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">52</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data3</span>, <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{outdir}/{chunk_id}"</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">93</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">53</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data3</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">94</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">54</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @importFrom future getGlobalsAndPackages</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">55</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">95</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">chunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getGlobalsAndPackages</span><span class="paren">(</span><span class="identifier">.f</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">parent.frame</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">96</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">175<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">97</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">58</td>
+                    <td class="coverage">175<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">lazy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">98</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"foverlaps.disk.frame: only merge_by_chunk_id = TRUE is implemented"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">=</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">99</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">c</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">100</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">61</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/left_join.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">62</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Performs join/merge for disk.frames</span></pre>
+                      <pre class="language-r">        <span class="identifier">list</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">63</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
+                      <pre class="language-r">          <span class="identifier">list</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">            <span class="identifier">func</span> <span class="operator">=</span> <span class="identifier">.f</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">            <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">vars_and_pkgs</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">66</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">            <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">          <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' join.df = left_join(cars.df, cars.df)</span></pre>
+                      <pre class="language-r">        <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">70</td>
+                    <td class="coverage">101<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">73</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">left_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_left_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">13</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">74</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">75</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">15</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">77</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">17</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">79</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"keep"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># note that x is named .data in the lazy evaluation</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">19</td>
-                    <td class="coverage">4<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">20</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">81</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">21</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="num">82</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">left_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">16<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">83</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">24</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">85</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">86</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">26</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">87</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">files_shortname</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">89</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">29</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">90</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">30</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">91</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">92</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">93</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">94</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">95</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">ii</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">96</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#res = lapply(1:length(files), function(ii) {</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">36</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">97</td>
+                    <td class="coverage">332<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">ds</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">cid</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span>, <span class="identifier">keep</span><span class="operator">=</span><span class="identifier">keep_future</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">98</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">99</td>
+                    <td class="coverage">332<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">left_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">ds</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">100</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#} else if ((identical(shardkey(x)$shardkey, "") &amp; identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {</span></pre>
+                      <pre class="language-r">    <span class="comment">#res = do.call(.f, c(ds, dotdotdot))</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">102</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="num">103</td>
+                    <td class="coverage">332<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="num">104</td>
+                    <td class="coverage">23<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">44</td>
+                    <td class="num">105</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The output chunk has 0 row, therefore chunk {ii} NOT written"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">21<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">106</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">107</td>
+                    <td class="coverage">23<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">files_shortname</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span><span class="paren">)</span>, <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">108</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="num">109</td>
+                    <td class="coverage">23<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">llj</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">lift</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">left_join</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">110</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#left_join(.x, .y, by = by, copy = copy, ...)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">50</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="num">111</td>
+                    <td class="coverage">309<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">llj</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span><span class="operator">=</span><span class="identifier">.x</span>, <span class="identifier">y</span> <span class="operator">=</span><span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">51</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">112</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">52</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">113</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">114</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">54</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">115</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">116</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">117</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">118</td>
+                    <td class="coverage">70<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">119</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">120</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/csv2disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">121</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Convert CSV file(s) to disk.frame format</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">122</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">123</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_delete</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">124</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">125</td>
+                    <td class="coverage">14<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param infile The input CSV file or files</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"cmap_dfr"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">126</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir The directory to output the disk.frame to</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">127</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param inmapfn A function to be applied to the chunk read in from CSV before</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">128</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   the chunk is being written out. Commonly used to perform simple</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">129</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   transformations. Defaults to the identity function (ie. no transformation)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">130</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks Number of chunks to output</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">131</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param in_chunk_size When reading in the file, how many lines to read in at</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">132</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   once. This is different to nchunks which controls how many chunks are</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">".id is not NULL, but the parameter is not used with cmap_dfr.disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">133</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   output</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">134</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby The column(s) to shard the data by. For example suppose</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">135</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   `shardby = c("col1","col2")`  then every row where the values `col1` and</span></pre>
+                      <pre class="language-r">  <span class="comment"># TODO warn the user if outdir is cmap_dfr</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">136</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   `col2` are the same will end up in the same chunk; this will allow merging</span></pre>
+                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">137</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   by `col1` and `col2` to be more efficient</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">138</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress For fst backends it's a number between 0 and 100 where 100 is</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">139</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   the highest compression ratio.</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">140</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite Whether to overwrite the existing directory</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">141</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param header Whether the files have header. Defaults to TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">142</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for</span></pre>
+                      <pre class="language-r"><span class="identifier">cimap</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">143</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"cimap"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">144</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param backend The CSV reader backend to choose: "data.table" or "readr". </span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">145</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   disk.frame does not have its own CSV reader. It uses either</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">146</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   data.table::fread or readr::read_delimited. It is worth noting that</span></pre>
+                      <pre class="language-r"><span class="comment">#' `cimap.disk.frame` accepts a two argument function where the first argument is a data.frame and the </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">147</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   data.table::fread does not detect dates and all dates are imported as</span></pre>
+                      <pre class="language-r"><span class="comment">#' second is the chunk ID</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">148</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   strings, and you are encouraged to use {fasttime} to convert the strings to</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">149</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   date. You can use the `inmapfn` to do that. However, if you want automatic</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">150</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   date detection, then backend="readr" may suit your needs. However, readr</span></pre>
+                      <pre class="language-r"><span class="identifier">cimap.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">chunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">31</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">151</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   is often slower than data.table, hence data.table is chosen as the default.</span></pre>
+                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">152</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunk_reader Even if you choose a backend there can still be multiple</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">153</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   strategies on how to approach the CSV reads. For example, data.table::fread</span></pre>
+                      <pre class="language-r">  <span class="comment"># TODO support lazy for cimap</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">34</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">154</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   tries to mmap the whole file which can cause the whole read process to</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">lazy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">35</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">155</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   fail. In that case we can change the chunk_reader to "readLines" which uses the</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"cimap.disk.frame: lazy = TRUE is not supported at this stage"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">36</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">156</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   readLines function to read chunk by chunk and still use data.table::fread</span></pre>
+                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"lazyfn"</span><span class="paren">)</span>, <span class="identifier">.f</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">37</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">157</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   to process the chunks. There are currently no strategies for readr backend,</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">158</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   except the default one.</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">159</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to data.table::fread, disk.frame::as.disk.frame,</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">40</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">160</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   disk.frame::shard</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">41</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">161</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
+                      <pre class="language-r">    <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">162</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#@importFrom LaF detect_dm_csv process_blocks</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">163</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom bigreadr split_file get_split_files</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">44</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">164</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">165</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">46</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">166</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"keep"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">167</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' tmpfile = tempfile()</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">48</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">168</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' write.csv(cars, tmpfile)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">49</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">169</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' tmpdf = tempfile(fileext = ".df")</span></pre>
+                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">170</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df = csv_to_disk.frame(tmpfile, outdir = tmpdf, overwrite = TRUE)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">171</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">52</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">172</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">53</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">173</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' fs::file_delete(tmpfile)</span></pre>
+                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">54</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">174</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(df)</span></pre>
+                      <pre class="language-r">  <span class="identifier">files_shortname</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">175</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">csv_to_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">56</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">176</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                              <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"data.table"</span>, <span class="string">"readr"</span>, <span class="string">"LaF"</span><span class="paren">)</span>, <span class="identifier">chunk_reader</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"bigreadr"</span>, <span class="string">"data.table"</span>, <span class="string">"readr"</span>, <span class="string">"readLines"</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">177</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">backend</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">58</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">178</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">chunk_reader</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">chunk_reader</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">ds</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">files_shortname</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span>, <span class="identifier">keep</span><span class="operator">=</span><span class="identifier">keep_future</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">59</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">179</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">ds</span>, <span class="identifier">ii</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">180</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span> <span class="operator">|</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">61</td>
+                    <td class="num">181</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"readr"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">files_shortname</span><span class="paren">[</span><span class="identifier">ii</span><span class="paren">]</span><span class="paren">)</span>, <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">62</td>
+                    <td class="num">182</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: You have chosen backend = 'readr' or chunk_reader = 'readr'. But `readr` package is not installed. To install run: `install_packages(\"readr\")`"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ii</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">183</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">64</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">184</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">185</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">186</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">67</td>
-                    <td class="coverage">11<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">68</td>
+                    <td class="num">187</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">69</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">188</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># we need multiple backend because data.table has poor support for the file is larger than RAM</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">70</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">189</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># https://github.com/Rdatatable/data.table/issues/3526</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">190</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># TODO detect these cases</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">72</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">191</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">192</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># user has requested chunk-wise reading but wants me to do it</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">193</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">194</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#if(is.null(in_chunk_size)) {</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">195</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">196</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#} else if(is.character(in_chunk_size) &amp;&amp; in_chunk_size == "guess") {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">197</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">cimap_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">79</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">198</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#library(bigreadr)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"cimap_dfr"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">199</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># system.time(wc_l &lt;- R.utils::countLines(infile))</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">200</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># system.time(infos_split &lt;- split_file(infile, every_nlines = 1e7))</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">201</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># file_parts &lt;- get_split_files(infos_split)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">83</td>
+                    <td class="num">202</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">   </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">203</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#} else</span></pre>
+                      <pre class="language-r"><span class="identifier">cimap_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">85</td>
-                    <td class="coverage">11<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">86</td>
-                    <td class="coverage">!</td>
+                    <td class="num">204</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span><span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">87</td>
+                    <td class="num">205</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rs</span> <span class="operator">=</span> <span class="identifier">df_ram_size</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">".id is not NULL, but the parameter is not used with cmap_dfr.disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">88</td>
+                    <td class="num">206</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">89</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">file.size</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">3</span><span class="paren">)</span><span class="operator">&gt;</span> <span class="identifier">rs</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">90</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: you are using backend = 'data.table' and chunk_reader = 'data.table'."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">91</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">207</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"But one of your input files is larger than available RAM {rs}."</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">cimap.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">92</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">208</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"if the file(s) fail to read, please set chunk_reader = 'readLines' or chunk_reader = 'readr'."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">93</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">209</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"E.g. csv_to_disk.frame(..., chunk_reader = 'readr')"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">210</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">95</td>
+                    <td class="num">211</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' `lazy` is convenience function to apply `.f` to every chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">96</td>
+                    <td class="num">212</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">97</td>
+                    <td class="num">213</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">98</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">214</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">lazy</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">99</td>
+                    <td class="num">215</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: you are trying to read multiple files."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"lazy"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">100</td>
+                    <td class="num">216</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#param_names = names(list(...))</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">101</td>
+                    <td class="num">217</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">102</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">103</td>
+                    <td class="num">218</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#if (!"colClasses" %in% param_names) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">104</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">219</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please use colClasses to set column types to minimize the chance of a failed read"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">105</td>
+                    <td class="num">220</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#}</span></pre>
+                      <pre class="language-r"><span class="identifier">lazy.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">106</td>
+                    <td class="num">221</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">107</td>
+                    <td class="num">222</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#if (!"col_types" %in% param_names) {</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">108</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">223</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please use col_types to set column types to minimize the chance of a failed read"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">109</td>
+                    <td class="num">224</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#}</span></pre>
+                      <pre class="language-r"><span class="comment">#' `delayed` is an alias for lazy and is consistent with the naming in Dask and Dagger.jl</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">110</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">225</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">111</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">226</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please check the documentation of LaF for how to set column classes"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">112</td>
+                    <td class="num">227</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">delayed</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">113</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">228</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend not supported"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"delayed"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">114</td>
+                    <td class="num">229</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">115</td>
+                    <td class="num">230</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">116</td>
+                    <td class="num">231</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">117</td>
-                    <td class="coverage">11<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">118</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">232</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"LaF"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">delayed.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">119</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">233</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"You need to install the LaF package to use backend = 'LaF'. To install: install.packages('LaF')"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">120</td>
+                    <td class="num">234</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">121</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">235</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">122</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">236</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend = 'LaF' only supports single file, not multiple files as `infile`"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">123</td>
+                    <td class="num">237</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">124</td>
+                    <td class="num">238</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">chunk_lapply</span> <span class="operator">&lt;-</span> <span class="keyword">function</span> <span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">125</td>
+                    <td class="num">239</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"chunk_lapply is deprecated in favour of cmap.disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">126</td>
+                    <td class="num">240</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: backend = 'LaF' can only be used when in_chunk_size != NULL"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">127</td>
+                    <td class="num">241</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/sample_frac.R" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">128</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' Sample n rows from a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">129</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">130</td>
-                    <td class="coverage">11<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"LaF"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">131</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df_out</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr sample_frac</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">132</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dm</span> <span class="operator">=</span> <span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detect_dm_csv</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @inheritParams dplyr::sample_frac</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">133</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">process_blocks</span><span class="paren">(</span><span class="identifier">LaF</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">laf_open</span><span class="paren">(</span><span class="identifier">dm</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">past</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname sample</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">134</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">135</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span> <span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">136</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df_out</span>, <span class="identifier">chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">137</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(sample_frac(cars.df, 0.5))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">138</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">139</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">140</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">141</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">df_out</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">sample_frac.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">tbl</span>, <span class="identifier">size</span><span class="operator">=</span><span class="number">1</span>, <span class="identifier">replace</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">weight</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">.env</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">142</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">14</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"data.table"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">143</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">15</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">csv_to_disk.frame_data.table_backend</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">weight</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">144</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">16</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"sample_frac: for disk.frames weight = is not supported"</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">145</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">17</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">outdir</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">146</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">18</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">inmapfn</span>, </pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.env</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">147</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">19</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">nchunks</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"sample_frac: for disk.frames .env = is not supported"</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">148</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">20</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">149</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shardby</span>, </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">150</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">compress</span>, </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">151</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">23</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">overwrite</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">fn</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">create_chunk_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sample_frac</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">152</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">header</span>, </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">153</td>
-                    <td class="coverage">11<em>x</em></td>
+                    <td class="num">25</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.progress</span>, <span class="keyword">...</span></pre>
+                      <pre class="language-r">  <span class="identifier">fn</span><span class="paren">(</span><span class="identifier">tbl</span>, <span class="identifier">size</span> <span class="operator">=</span> <span class="identifier">size</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="identifier">replace</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">154</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">155</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"bigreadr"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">156</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># use bigreadr to split the files</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">157</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tf</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">158</td>
-                    <td class="coverage">!</td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/zzz.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">.onLoad</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">libname</span>, <span class="identifier">pkgname</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">159</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">160</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Stage 1 of 2: splitting the file {infile} into smallers files:"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">161</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Destination: {tf}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">162</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future nbrOfWorkers</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">163</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom crayon red blue green</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">164</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">split_file_info</span> <span class="operator">=</span> <span class="identifier">bigreadr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">split_file</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="identifier">.onAttach</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">libname</span>, <span class="identifier">pkgname</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">165</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                      <pre class="language-r">  <span class="comment">#setup_disk.frame()</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">166</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">every_nlines</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">167</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">10</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">prefix_out</span> <span class="operator">=</span> <span class="identifier">tf</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">packageStartupMessage</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">168</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">11</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">repeat_header</span> <span class="operator">=</span> <span class="identifier">header</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">crayon</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">red</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">169</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">12</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">files_split</span> <span class="operator">=</span> <span class="identifier">bigreadr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_split_files</span><span class="paren">(</span><span class="identifier">split_file_info</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">170</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">13</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 1 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    "\n\n## Message from disk.frame:</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">171</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">14</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">We</span> <span class="identifier">have</span> <span class="paren">{</span><span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span><span class="paren">}</span> <span class="identifier">workers</span> <span class="identifier">to</span> <span class="identifier">use</span> <span class="identifier">with</span> <span class="identifier">disk.frame</span>.</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">172</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">15</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">To change that, use setup_disk.frame(workers = n) or just setup_disk.frame() to use the defaults.")),</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">173</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">16</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt2</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    crayon::green("\n\n</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">174</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">17</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Stage 2 of 2: Converting the smaller files into disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">It</span> <span class="identifier">is</span> <span class="identifier">recommended</span> <span class="identifier">that</span> <span class="identifier">you</span> <span class="identifier">run</span> <span class="identifier">the</span> <span class="identifier">following</span> <span class="identifier">immediately</span> <span class="identifier">to</span> <span class="identifier">set</span> <span class="identifier">up</span> <span class="identifier">disk.frame</span> <span class="identifier">with</span> <span class="identifier">multiple</span> <span class="identifier">workers</span> <span class="keyword">in</span> <span class="identifier">order</span> <span class="identifier">to</span> <span class="identifier">parallelize</span> <span class="identifier">your</span> <span class="identifier">operations</span><span class="operator">:</span>\<span class="identifier">n</span>\<span class="identifier">n</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">175</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">18</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">```r</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">176</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment"># this will set up disk.frame with multiple workers</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">177</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">20</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">csv_to_disk.frame</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="identifier">setup_disk.frame</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">178</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">files_split</span>, </pre>
+                      <pre class="language-r"><span class="comment"># this will allow unlimited amount of data to be passed from worker to worker</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">179</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">22</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>,</pre>
+                      <pre class="language-r"><span class="identifier">options</span><span class="paren">(</span><span class="identifier">future.globals.maxSize</span> <span class="operator">=</span> <span class="literal">Inf</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">180</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">inmapfn</span>, </pre>
+                      <pre class="language-r">```</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">181</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">24</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
+                      <pre class="language-r">\n\n"))</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">182</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">183</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">184</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">27</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, </pre>
+                      <pre class="language-r"><span class="identifier">globalVariables</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">185</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">28</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span>, </pre>
+                      <pre class="language-r">                  <span class="string">"sym"</span>, <span class="comment"># from dplyr</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">186</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">29</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span>,</pre>
+                      <pre class="language-r">                  <span class="string">"type"</span>, <span class="comment"># used in bloomfilter</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">187</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">30</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">backend</span> <span class="operator">=</span> <span class="identifier">backend</span>,</pre>
+                      <pre class="language-r">                  <span class="string">"size"</span>, <span class="comment"># used in bloomfilter</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">188</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"modification_time"</span>, <span class="comment"># used in bloomfilter</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">189</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">                  <span class="string">"name"</span>, <span class="comment"># used in gen_summ_code</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">190</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"agg_expr"</span>, <span class="comment"># used in gen_summ_code</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">191</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"orig_code"</span>, <span class="comment"># used in gen_summ_code</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">192</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">                  <span class="string">"syms"</span>, <span class="comment"># needed by dplyr to treat something as a symbol</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">193</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">36</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 &amp; 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"."</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">194</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">".BY"</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">195</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">                  <span class="string">".N"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">196</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">".SD"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">197</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readLines"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                  <span class="string">".out.disk.frame.id"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">198</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">41</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                  <span class="string">":="</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">199</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># establish a read connection to the file</span></pre>
+                      <pre class="language-r">                  <span class="string">"N"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">200</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">con</span> <span class="operator">=</span> <span class="identifier">file</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="string">"r"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"area"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">201</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">44</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">con</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"chunk_id"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">202</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">readLines</span><span class="paren">(</span><span class="identifier">con</span>, <span class="identifier">n</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"coltypes"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">203</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">46</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">diskf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"coltypes.x"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">204</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">header_copy</span> <span class="operator">=</span> <span class="identifier">header</span></pre>
+                      <pre class="language-r">                  <span class="string">"coltypes.y"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">205</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">48</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                      <pre class="language-r">                  <span class="string">"ctot"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">206</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">xx</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                  <span class="string">"existing_df"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">207</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">colnames_copy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                  <span class="string">"feature_s"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">208</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">51</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header_copy</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"h"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">209</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">52</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"height"</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">210</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                  <span class="string">"incompatible_types"</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">211</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="comment"># TODO detect the correct delim; manually adding header</span></pre>
+                      <pre class="language-r">                  <span class="string">"lag_height"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">212</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">55</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">header_colnames</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">colnames_copy</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">","</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"new_chunk"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">213</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">header_colnames</span>, <span class="identifier">xx</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                  <span class="string">"ok"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">214</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">57</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                      <pre class="language-r">                  <span class="string">"pathA"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">215</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">58</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r">                  <span class="string">"pathB"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">216</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">59</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                      <pre class="language-r">                  <span class="string">"w"</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">217</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">60</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span></pre>
+                      <pre class="language-r">                  <span class="string">"xid"</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">218</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                      <pre class="language-r">                  <span class="string">"yid"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">219</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">220</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @useDynLib disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">221</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom Rcpp evalCpp</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">222</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#@exportPattern "^[[:alpha:]]+"</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">223</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="literal">NULL</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">224</td>
-                    <td class="coverage">!</td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/glm.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">diskf</span>, <span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Fit generalized linear models (glm) with disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">225</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">readLines</span><span class="paren">(</span><span class="identifier">con</span>, <span class="identifier">n</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">226</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">header_copy</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @inherit biglm::bigglm</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">227</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">228</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">diskf</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description  </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">229</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Fits GLMs using `{speedglm}` or `{biglm}`. The return object will be exactly as</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">230</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"chunk_reader = 'readLines' is not yet supported for multiple files"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' those return by those functions. This is a convenience wrapper</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">231</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">232</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"data.table"</span> <span class="operator">&amp;</span> <span class="identifier">chunk_reader</span> <span class="operator">==</span> <span class="string">"readr"</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param glm_backend Which package to use for fitting GLMs. The default is</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">233</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   "biglm", which has known issues with factor level if different levels are</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">234</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">diskf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   present in different chunks. The "speedglm" option is more robust, but does not</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">235</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#'   implement `predict` which makes prediction and implementation impossible.</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">236</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">colnames_copy</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">237</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_lines_chunked</span><span class="paren">(</span><span class="identifier">file</span> <span class="operator">=</span> <span class="identifier">infile</span>, <span class="identifier">callback</span> <span class="operator">=</span> <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="keyword">function</span><span class="paren">(</span><span class="identifier">xx</span>, <span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @family Machine Learning (ML)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">238</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">239</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">colnames_copy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">240</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">241</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">242</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' m = dfglm(dist ~ speed, data = cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">243</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">244</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                      <pre class="language-r"><span class="comment">#' # can use normal R functions</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">245</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # Only works in version &gt; R 3.6</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">246</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' majorv = as.integer(version$major)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">247</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">colnames_copy</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' minorv = as.integer(strsplit(version$minor, ".", fixed=TRUE)[[1]][1])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">248</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' if(((majorv == 3) &amp; (minorv &gt;= 6)) | (majorv &gt; 3)) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">249</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">header_colnames</span> <span class="operator">=</span> <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">colnames_copy</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">","</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   summary(m)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">250</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">27</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">xx</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">header_colnames</span>, <span class="identifier">xx</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   predict(m, get_chunk(cars.df, 1))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">251</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">28</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#'   predict(m, collect(cars.df))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">252</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">29</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#'   # can use broom to tidy up the returned info</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">253</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">30</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">xx</span>, </pre>
+                      <pre class="language-r"><span class="comment">#'   broom::tidy(m)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">254</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">31</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#' }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">255</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              , <span class="keyword">...</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">256</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">257</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">258</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">dfglm</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">data</span>, <span class="keyword">...</span>, <span class="identifier">glm_backend</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"biglm"</span>, <span class="string">"speedglm"</span>, <span class="string">"biglmm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">259</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">diskf</span>, <span class="identifier">new_chunk</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">glm_backend</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">glm_backend</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">260</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, <span class="identifier">progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">261</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">  <span class="comment"># compute the major version</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">262</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">diskf</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">majorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">major</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">40</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">minorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">minor</span>, <span class="string">"."</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">263</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">264</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">42</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"chunk_reader = 'readr' is not yet supported for multiple files"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">majorv</span> <span class="operator">==</span> <span class="number">3</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="paren">(</span><span class="identifier">minorv</span> <span class="operator">&lt;</span> <span class="number">6</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"biglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">265</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"{bigglm} is not supported for R version below 3.6; auto switched to {speedglm}"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">266</td>
+                    <td class="num">44</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">backend</span> <span class="operator">==</span> <span class="string">"readr"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">glm_backend</span> <span class="operator">=</span> <span class="string">"speedglm"</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">267</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if(is.null(in_chunk_size)) {</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">268</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   stop("for readr backend, only in_chunk_size != NULL is supported")</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">269</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># } else if (!is.null(shardby)) {</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">data</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">streaming_fn</span> <span class="operator">&lt;-</span> <span class="identifier">make_glm_streaming_fn</span><span class="paren">(</span><span class="identifier">data</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">270</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#   stop("for readr backend, only shardby == NULL is supported")</span></pre>
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">50</td>
+                    <td class="coverage">2<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"speedglm"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"speedglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">52</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"speedglm package not installed. To install run `install.packages('speedglm')`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">271</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># }</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">272</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">csv_to_disk.frame_readr</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="identifier">speedglm</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shglm</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">streaming_fn</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">273</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">infile</span>, </pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"biglm"</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">274</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">56</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"biglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">275</td>
+                    <td class="num">57</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">inmapfn</span><span class="operator">=</span><span class="identifier">inmapfn</span>, </pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"biglm package not installed. To install run `install.packages('biglm')`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">276</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">58</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">nchunks</span>, </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">277</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">in_chunk_size</span><span class="operator">=</span><span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">biglm</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">bigglm</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">data</span> <span class="operator">=</span> <span class="identifier">streaming_fn</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">278</td>
+                    <td class="num">60</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shardby</span><span class="operator">=</span><span class="identifier">shardby</span>, </pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"biglmm"</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">279</td>
+                    <td class="num">61</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">compress</span><span class="operator">=</span><span class="identifier">compress</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"biglmm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">280</td>
+                    <td class="num">62</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">overwrite</span><span class="operator">=</span><span class="literal">TRUE</span>, </pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"biglmm package not installed. To install run `install.packages('biglmm')`"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">281</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">63</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">col_names</span><span class="operator">=</span><span class="identifier">header</span>, </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">282</td>
+                    <td class="num">64</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.progress</span><span class="operator">=</span><span class="identifier">.progress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">biglmm</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">bigglm</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">data</span> <span class="operator">=</span> <span class="identifier">streaming_fn</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">283</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">284</td>
+                    <td class="num">66</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"csv_to_disk.frame: this set of options is not supported"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"glm_backend must be one of 'speedglm' or 'biglm' or 'biglmm'"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">285</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">286</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/hard_group_by.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">287</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Show a progress bar of the action being performed</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">288</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom utils txtProgressBar setTxtProgressBar</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">289</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">csv_to_disk.frame_data.table_backend</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">290</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                                                 <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">291</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># reading multiple files</span></pre>
+                      <pre class="language-r"><span class="identifier">progressbar</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">292</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">6</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"performing"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"hard_group_by"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">293</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># create progress bar</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">294</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">origarg</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">inmapfn</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">295</td>
+                    <td class="num">9</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                   <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">shardby</span> <span class="operator">=</span> <span class="string">"acct_id"</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">296</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                   <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">header</span> <span class="operator">=</span> <span class="identifier">header</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#list.files(</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">297</td>
+                    <td class="num">11</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dotdotdotorigarg</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">dotdotdot</span>, <span class="identifier">origarg</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fparent</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"parent"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">298</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">299</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#tmp = file.path(fparent,".performing","inchunks")</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">300</td>
+                    <td class="num">14</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp</span> <span class="operator">=</span> <span class="string">"tmphardgroupby2"</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">301</td>
+                    <td class="num">16</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"-- Converting CSVs to disk.frame --"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">fparent</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">302</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">17</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">    <span class="identifier">pt_begin_split</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">303</td>
+                    <td class="num">18</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Converting {length(infile)} CSVs to {nchunks} disk.frame each consisting of {nchunks} chunks (Stage 1 of 2):"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">doprog</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">pt_from</span>, <span class="identifier">sleep</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">304</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment">#tkpb = winProgressBar(title = sprintf("Hard Group By Stage 1(/2) - %s", shardby), label = "Checking completeness",</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">305</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="comment">#                      min = 0, max = l*1.5, initial = 0, width = 500)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">306</td>
+                    <td class="num">21</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">outdf_tmp</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_imap</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">pb</span> <span class="operator">&lt;-</span> <span class="identifier">txtProgressBar</span><span class="paren">(</span><span class="identifier">min</span> <span class="operator">=</span> <span class="number">0</span>, <span class="identifier">max</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">*</span><span class="number">1.5</span>, <span class="identifier">style</span> <span class="operator">=</span> <span class="number">3</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">307</td>
+                    <td class="num">23</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dotdotdotorigarg1</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">dotdotdotorigarg</span>, <span class="identifier">list</span><span class="paren">(</span><span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tempdir</span><span class="paren">(</span><span class="paren">)</span>, <span class="identifier">.y</span><span class="paren">)</span>, <span class="identifier">infile</span><span class="operator">=</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">pb</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">308</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">      <span class="comment"># on.exit(close(tkpb))</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">309</td>
+                    <td class="num">25</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">csv_to_disk.frame_data.table_backend</span>, <span class="identifier">dotdotdotorigarg1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">&lt;</span> <span class="identifier">l</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">310</td>
+                    <td class="num">26</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">wl</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="operator">/</span><span class="identifier">l</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">27</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">tt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span> <span class="operator">-</span> <span class="identifier">pt_from</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">311</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">        <span class="comment">#list.files(</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">312</td>
+                    <td class="num">29</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">avg_speed</span> <span class="operator">=</span> <span class="identifier">tt</span><span class="operator">/</span><span class="identifier">wl</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">313</td>
+                    <td class="num">30</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 1 or 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">pred_speed</span> <span class="operator">=</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="paren">(</span><span class="identifier">l</span><span class="operator">-</span><span class="identifier">wl</span><span class="paren">)</span> <span class="operator">+</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="identifier">l</span><span class="operator">/</span><span class="number">2</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">314</td>
+                    <td class="num">31</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">elapsed</span> <span class="operator">=</span> <span class="identifier">round</span><span class="paren">(</span><span class="identifier">tt</span><span class="operator">/</span><span class="number">60</span>,<span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">315</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">        </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">316</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">        <span class="comment">#setWinProgressBar(tkpb, wl, </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">317</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#                  title = sprintf("Hard Group By Stage 1(/2) - %s", shardby),</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">35</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Row-binding the {nchunks} disk.frames together to form one large disk.frame (Stage 2 of 2):"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="comment">#                  label = sprintf("%.0f out of %d; avg speed %.2f mins; elapsed %.1f mins; another %.1f mins", wl,l, round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">318</td>
+                    <td class="num">36</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Creating the disk.frame at {outdir}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">setTxtProgressBar</span><span class="paren">(</span><span class="identifier">pb</span>, <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">319</td>
+                    <td class="num">37</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt2</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">                          <span class="identifier">title</span> <span class="operator">=</span> <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Group By - %s"</span>, <span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">320</td>
+                    <td class="num">38</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">outdf</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">outdf_tmp</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="identifier">sleep</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">321</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">322</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">323</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">324</td>
+                    <td class="num">41</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 2 of 2 took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">doprog</span><span class="paren">(</span><span class="identifier">pt_begin_split</span>, <span class="number">1</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">42</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">325</td>
+                    <td class="num">43</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">" ----------------------------------------------------- "</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">pt_begin_collate</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">326</td>
+                    <td class="num">44</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste</span><span class="paren">(</span><span class="string">"Stage 1 &amp; 2 in total took:"</span>, <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">timetaken</span><span class="paren">(</span><span class="identifier">pt</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">doprog2</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">pt_from</span>, <span class="identifier">sleep</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">327</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment"># tkpb = winProgressBar(title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating", shardby), label = "Checking completeness",</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">328</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">                            <span class="comment"># min = 0, max = l*1.5, initial = 0, width = 600)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">329</td>
+                    <td class="num">47</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">outdf</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">pb</span> <span class="operator">&lt;-</span> <span class="identifier">txtProgressBar</span><span class="paren">(</span><span class="identifier">min</span> <span class="operator">=</span> <span class="number">0</span>, <span class="identifier">max</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">*</span><span class="number">1.5</span>, <span class="identifier">style</span> <span class="operator">=</span> <span class="number">3</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">330</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># reading one file</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">331</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">49</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">pb</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">332</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment"># on.exit(close(tkpb))</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">333</td>
-                    <td class="coverage">9<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">51</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">&lt;</span> <span class="identifier">l</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">334</td>
-                    <td class="coverage">9<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">52</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">as.disk.frame</span><span class="paren">(</span><span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span><span class="operator">=</span><span class="identifier">header</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">outdir</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="identifier">compress</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">wl</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">335</td>
-                    <td class="coverage">9<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">53</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">tt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span> <span class="operator">-</span> <span class="identifier">pt_from</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">336</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="comment">#list.files(</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">337</td>
+                    <td class="num">55</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">outdf</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">avg_speed</span> <span class="operator">=</span> <span class="identifier">tt</span><span class="operator">/</span><span class="identifier">wl</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">338</td>
+                    <td class="num">56</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="number">0</span></pre>
+                      <pre class="language-r">        <span class="identifier">pred_speed</span> <span class="operator">=</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="paren">(</span><span class="identifier">l</span><span class="operator">-</span><span class="identifier">wl</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">339</td>
+                    <td class="num">57</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">tmpdir1</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">pattern</span><span class="operator">=</span><span class="string">"df_tmp"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">elapsed</span> <span class="operator">=</span> <span class="identifier">round</span><span class="paren">(</span><span class="identifier">tt</span><span class="operator">/</span><span class="number">60</span>,<span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">340</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">58</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">341</td>
+                    <td class="num">59</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r">        <span class="comment"># setWinProgressBar(tkpb, l + wl/2, </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">342</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">60</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                      <pre class="language-r">        <span class="comment">#                   title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating -- %.0f out of %d chunks processed;", shardby, wl, l),</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">343</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">61</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r">        <span class="comment">#                   label = sprintf("avg %.2f min/chunk; %.1f mins elapsed; %.1f mins remaining;", round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">344</td>
+                    <td class="num">62</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">column_names</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                      <pre class="language-r">        <span class="identifier">setTxtProgressBar</span><span class="paren">(</span><span class="identifier">pb</span>, <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">345</td>
+                    <td class="num">63</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                          <span class="identifier">title</span> <span class="operator">=</span> <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Hard Group By - %s"</span>, <span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">346</td>
+                    <td class="num">64</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">column_names</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="identifier">sleep</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">347</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">65</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">348</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">66</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">349</td>
+                    <td class="num">67</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">doprog2</span><span class="paren">(</span><span class="identifier">pt_begin_collate</span>, <span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">350</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">68</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">column_names</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">351</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">352</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">70</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">353</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">71</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="keyword">if</span> <span class="paren">(</span><span class="string">"col.names"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ddd</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Perform a hard group</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">354</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">72</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">355</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">73</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' A hard_group_by is a group by that also reorganizes the chunks to ensure that</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">356</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">74</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' every unique grouping of `by`` is in the same chunk. Or in other words, every</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">357</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">75</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' row that share the same `by` value will end up in the same chunk.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">358</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">359</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">77</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... grouping variables</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">360</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">78</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">79</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">361</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">80</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the out put directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">362</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">81</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">col.names</span> <span class="operator">=</span> <span class="identifier">column_names</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param add same as dplyr::group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">363</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .drop same as dplyr::group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">364</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">365</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          </pre>
+                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">366</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">85</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">367</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">86</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="identifier">skiprows</span> <span class="operator">+</span> <span class="identifier">in_chunk_size</span> <span class="operator">+</span> </pre>
+                      <pre class="language-r"><span class="comment">#' @param sort_split_sample_size for the "sort" shardby function, if sort_splits is null, the number of rows to sample per chunk for random splits.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">368</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="comment"># skips the header as well but only at the first chunk</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">369</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">88</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">i</span> <span class="operator">==</span> <span class="number">1</span> <span class="operator">&amp;</span> <span class="identifier">header</span>, <span class="number">1</span>, <span class="number">0</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">370</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">89</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">rows</span> <span class="operator">&lt;-</span> <span class="identifier">tmpdt</span><span class="paren">[</span>,<span class="identifier">.N</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' iris.df = as.disk.frame(iris, nchunks = 2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">371</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">90</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rows</span> <span class="operator">&lt;</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">372</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">91</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">done</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#' # group_by iris.df by specifies and ensure rows with the same specifies are in the same chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">373</td>
+                    <td class="num">92</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' iris_hard.df = hard_group_by(iris.df, Species)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">374</td>
+                    <td class="num">93</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">375</td>
+                    <td class="num">94</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="comment"># add to chunk</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 1)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">376</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">95</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">outdf</span>, <span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">377</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">96</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">378</td>
+                    <td class="num">97</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">379</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">380</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">99</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"read {in_chunk_size*(i-1) + rows} rows from {infile}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(iris_hard.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">381</td>
+                    <td class="num">100</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"><span class="identifier">hard_group_by</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">101</td>
+                    <td class="coverage">51<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"hard_group_by"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">382</td>
+                    <td class="num">102</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># remove the files</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">383</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">103</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">384</td>
+                    <td class="num">104</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname hard_group_by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">385</td>
+                    <td class="num">105</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># so shard by some element</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">386</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">106</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">387</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">107</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="identifier">hard_group_by.data.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">388</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">108</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">header</span><span class="operator">=</span><span class="identifier">header</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">389</td>
+                    <td class="num">109</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">390</td>
+                    <td class="num">110</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">391</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">111</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="number">0</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname hard_group_by</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">392</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">112</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">tmpdir1</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">pattern</span><span class="operator">=</span><span class="string">"df_tmp"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">393</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">113</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">394</td>
+                    <td class="num">114</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#message(tmpdir1)</span></pre>
+                      <pre class="language-r"><span class="identifier">hard_group_by.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">395</td>
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r">    <span class="identifier">df</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">396</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">116</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">done</span> <span class="operator">=</span> <span class="literal">FALSE</span></pre>
+                      <pre class="language-r">    <span class="keyword">...</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">397</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">117</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r">    <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_hard_group_by"</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">398</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">118</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">column_names</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                      <pre class="language-r">    <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">399</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">119</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">400</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">120</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">column_names</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">401</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">121</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">402</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">122</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r">    <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">403</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">123</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">sort_split_sample_size</span><span class="operator">=</span><span class="number">100</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">404</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">124</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">column_names</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">405</td>
+                    <td class="num">125</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">406</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">126</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">407</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">127</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="keyword">if</span> <span class="paren">(</span><span class="string">"col.names"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">ddd</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">408</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">128</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="identifier">ff</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">409</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">129</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"hash"</span>, <span class="string">"sort"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">410</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">130</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">411</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">131</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"sort"</span> <span class="operator">&amp;&amp;</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">sort_splits</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">412</td>
+                    <td class="num">132</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment"># Sample enough per chunk to generate reasonable splits</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">413</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">133</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">tmpdt</span> <span class="operator">=</span> <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="identifier">sample_size_per_chunk</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">/</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">*</span> <span class="identifier">sort_split_sample_size</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">414</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">134</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">infile</span>,</pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">415</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">135</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">skip</span> <span class="operator">=</span> <span class="identifier">skiprows</span>, <span class="identifier">nrows</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>, </pre>
+                      <pre class="language-r">    <span class="comment"># Sample and sort</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">416</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">136</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">header</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">col.names</span> <span class="operator">=</span> <span class="identifier">column_names</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sample_n</span>, <span class="identifier">size</span><span class="operator">=</span><span class="identifier">sample_size_per_chunk</span>, <span class="identifier">replace</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">417</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">137</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">select</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">418</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">138</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">collect</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">419</td>
+                    <td class="num">139</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">420</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">140</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">i</span> <span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r">    <span class="comment"># NSE</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">421</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">141</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">skiprows</span> <span class="operator">=</span> <span class="identifier">skiprows</span> <span class="operator">+</span> <span class="identifier">in_chunk_size</span> <span class="operator">+</span> </pre>
+                      <pre class="language-r">    <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">422</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">142</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="comment"># skips the header as well but only at the first chunk</span></pre>
+                      <pre class="language-r">      <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">423</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">143</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">ifelse</span><span class="paren">(</span><span class="identifier">i</span> <span class="operator">==</span> <span class="number">1</span> <span class="operator">&amp;</span> <span class="identifier">header</span>, <span class="number">1</span>, <span class="number">0</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">arrange</span><span class="paren">(</span><span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">syms</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">424</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">144</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">rows</span> <span class="operator">&lt;-</span> <span class="identifier">tmpdt</span><span class="paren">[</span>,<span class="identifier">.N</span><span class="paren">]</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">425</td>
+                    <td class="num">145</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rows</span> <span class="operator">&lt;</span> <span class="identifier">in_chunk_size</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">426</td>
+                    <td class="num">146</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">done</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
+                      <pre class="language-r">        <span class="identifier">arrange</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">427</td>
+                    <td class="num">147</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">428</td>
+                    <td class="num">148</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">429</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">tmp.disk.frame</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">430</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">149</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">tmpdt</span>, </pre>
+                      <pre class="language-r">    <span class="comment"># If 100 chunks, this return get 99 splits based on percentiles.</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">431</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">150</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">ntiles</span> <span class="operator">&lt;-</span> <span class="identifier">round</span><span class="paren">(</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="operator">-</span><span class="number">1</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">*</span> <span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">sort_splits_sample</span><span class="paren">)</span> <span class="operator">/</span> <span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">432</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">151</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">433</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">152</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmpdir1</span>,<span class="identifier">i</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">    <span class="comment"># Get splits. May lead to less than nchunks if duplicates are selected.</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">434</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">153</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,</pre>
+                      <pre class="language-r">    <span class="identifier">sort_splits</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">435</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">154</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">slice</span><span class="paren">(</span><span class="identifier">ntiles</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">436</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">155</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">tmpdt</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">distinct</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">437</td>
+                    <td class="num">156</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">438</td>
+                    <td class="num">157</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">439</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">158</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"read {in_chunk_size*(i-1) + rows} rows from {infile}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># test if the unlist it will error</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">440</td>
+                    <td class="num">159</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#</span></pre>
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">160</td>
+                    <td class="coverage">51<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">441</td>
+                    <td class="num">161</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># do not run this in parallel as the level above this is likely in parallel</span></pre>
+                      <pre class="language-r">    <span class="comment"># This will return the variable names</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">442</td>
+                    <td class="num">162</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># ZJ:</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">443</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">163</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">system.time</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="comment"># TODO use better ways to do NSE</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">444</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">164</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">fnl_out</span> <span class="operator">&lt;-</span> </pre>
+                      <pre class="language-r">    <span class="comment"># the below will fail if indeed ... can not be list-ed</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">445</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">165</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="comment"># there should be a better way to do this</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">446</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">166</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">lapply</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">447</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">167</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                <span class="identifier">list.files</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">448</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">168</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="identifier">tmpdir1</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">disk.frame</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">    <span class="comment"># shard and create temporary diskframes</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">449</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">169</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">              <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">parallel</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp_df</span>  <span class="operator">=</span> <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">450</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">170</td>
+                    <td class="coverage">230<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r">      <span class="identifier">tmpdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">451</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">171</td>
+                    <td class="coverage">230<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># remove the files</span></pre>
+                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tmpdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">452</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">172</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">tmpdir1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">453</td>
+                    <td class="num">173</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">454</td>
+                    <td class="num">174</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">455</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">175</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># now rbindlist</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">456</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">176</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">457</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">177</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">458</td>
+                    <td class="num">178</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="comment"># clean up the tmp dir</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">459</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">179</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/hard_group_by.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">180</td>
+                    <td class="coverage">230<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Show a progress bar of the action being performed</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">181</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom utils txtProgressBar setTxtProgressBar</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">182</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">183</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">184</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">progressbar</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">res1</span> <span class="operator">&lt;-</span> <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">6</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">185</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"performing"</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"hard_group_by"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"character"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">186</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># create progress bar</span></pre>
+                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'res1 = chunk_group_by(res, {paste(by,collapse=",")})'</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">187</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">9</td>
+                    <td class="num">188</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shardby</span> <span class="operator">=</span> <span class="string">"acct_id"</span></pre>
+                      <pre class="language-r">      <span class="identifier">res1</span> <span class="operator">=</span> <span class="identifier">res</span> <span class="operator">%&gt;%</span> <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">(</span><span class="paren">{</span><span class="paren">{</span><span class="identifier">by</span><span class="paren">}</span><span class="paren">}</span><span class="paren">)</span> </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">189</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#list.files(</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">11</td>
+                    <td class="num">190</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fparent</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"parent"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'res1 = chunk_group_by(res, {paste(by,collapse=",")})'</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">191</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">192</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#tmp = file.path(fparent,".performing","inchunks")</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">14</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">193</td>
+                    <td class="coverage">51<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">res1</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">194</td>
+                    <td class="coverage">51<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp</span> <span class="operator">=</span> <span class="string">"tmphardgroupby2"</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">195</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="comment">#message(e)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">16</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">196</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">fparent</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># This will return the variable names</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">17</td>
+                    <td class="num">197</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt_begin_split</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">18</td>
+                    <td class="num">198</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">doprog</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">pt_from</span>, <span class="identifier">sleep</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">substr</span><span class="paren">(</span><span class="number">2</span>, <span class="identifier">nchar</span><span class="paren">(</span>.<span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">199</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#tkpb = winProgressBar(title = sprintf("Hard Group By Stage 1(/2) - %s", shardby), label = "Checking completeness",</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">200</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#                      min = 0, max = l*1.5, initial = 0, width = 500)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">21</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">201</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">pb</span> <span class="operator">&lt;-</span> <span class="identifier">txtProgressBar</span><span class="paren">(</span><span class="identifier">min</span> <span class="operator">=</span> <span class="number">0</span>, <span class="identifier">max</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">*</span><span class="number">1.5</span>, <span class="identifier">style</span> <span class="operator">=</span> <span class="number">3</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">202</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">    <span class="comment"># shard and create temporary diskframes</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">23</td>
+                    <td class="num">203</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">pb</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># on.exit(close(tkpb))</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp_df</span>  <span class="operator">=</span> <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">25</td>
+                    <td class="num">204</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">&lt;</span> <span class="identifier">l</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">tmpdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">26</td>
+                    <td class="num">205</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">wl</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="operator">/</span><span class="identifier">l</span></pre>
+                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tmpdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">27</td>
+                    <td class="num">206</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">tt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span> <span class="operator">-</span> <span class="identifier">pt_from</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">207</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#list.files(</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">29</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">208</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">avg_speed</span> <span class="operator">=</span> <span class="identifier">tt</span><span class="operator">/</span><span class="identifier">wl</span></pre>
+                      <pre class="language-r">    <span class="comment"># now rbindlist</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">30</td>
+                    <td class="num">209</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pred_speed</span> <span class="operator">=</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="paren">(</span><span class="identifier">l</span><span class="operator">-</span><span class="identifier">wl</span><span class="paren">)</span> <span class="operator">+</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="identifier">l</span><span class="operator">/</span><span class="number">2</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">31</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">210</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">elapsed</span> <span class="operator">=</span> <span class="identifier">round</span><span class="paren">(</span><span class="identifier">tt</span><span class="operator">/</span><span class="number">60</span>,<span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">211</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r">    <span class="comment"># clean up the tmp dir</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">33</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">212</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#setWinProgressBar(tkpb, wl, </span></pre>
+                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">213</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">214</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#                  title = sprintf("Hard Group By Stage 1(/2) - %s", shardby),</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">215</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#                  label = sprintf("%.0f out of %d; avg speed %.2f mins; elapsed %.1f mins; another %.1f mins", wl,l, round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">36</td>
+                    <td class="num">216</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">setTxtProgressBar</span><span class="paren">(</span><span class="identifier">pb</span>, <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">tmp</span>,<span class="identifier">l</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">res1</span> <span class="operator">=</span> <span class="identifier">res</span> <span class="operator">%&gt;%</span> <span class="identifier">chunk_group_by</span><span class="paren">(</span><span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">syms</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">37</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">217</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                          <span class="identifier">title</span> <span class="operator">=</span> <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Group By - %s"</span>, <span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">38</td>
+                    <td class="num">218</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="identifier">sleep</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">219</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">220</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">doprog</span><span class="paren">(</span><span class="identifier">pt_begin_split</span>, <span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/move_to.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">pt_begin_collate</span> <span class="operator">=</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Move or copy a disk.frame to another location</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">doprog2</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">pt_from</span>, <span class="identifier">sleep</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># tkpb = winProgressBar(title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating", shardby), label = "Checking completeness",</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df The disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                            <span class="comment"># min = 0, max = l*1.5, initial = 0, width = 600)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir The new location</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">pb</span> <span class="operator">&lt;-</span> <span class="identifier">txtProgressBar</span><span class="paren">(</span><span class="identifier">min</span> <span class="operator">=</span> <span class="number">0</span>, <span class="identifier">max</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">*</span><span class="number">1.5</span>, <span class="identifier">style</span> <span class="operator">=</span> <span class="number">3</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param copy Merely copy and not move</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' @param ... NOT USED</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">49</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">on.exit</span><span class="paren">(</span><span class="identifier">close</span><span class="paren">(</span><span class="identifier">pb</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># on.exit(close(tkpb))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">51</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">while</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">&lt;</span> <span class="identifier">l</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">wl</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">53</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">tt</span> <span class="operator">&lt;-</span> <span class="identifier">proc.time</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span> <span class="operator">-</span> <span class="identifier">pt_from</span><span class="paren">[</span><span class="number">3</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#list.files(</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">avg_speed</span> <span class="operator">=</span> <span class="identifier">tt</span><span class="operator">/</span><span class="identifier">wl</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars_copy.df = copy_df_to(cars.df, outdir = tempfile(fileext=".df"))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">56</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">pred_speed</span> <span class="operator">=</span> <span class="identifier">avg_speed</span><span class="operator">*</span><span class="paren">(</span><span class="identifier">l</span><span class="operator">-</span><span class="identifier">wl</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">57</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">elapsed</span> <span class="operator">=</span> <span class="identifier">round</span><span class="paren">(</span><span class="identifier">tt</span><span class="operator">/</span><span class="number">60</span>,<span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2.df = move_to(cars.df, outdir = tempfile(fileext=".df"))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># setWinProgressBar(tkpb, l + wl/2, </span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#                   title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating -- %.0f out of %d chunks processed;", shardby, wl, l),</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars_copy.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#                   label = sprintf("avg %.2f min/chunk; %.1f mins elapsed; %.1f mins remaining;", round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">62</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">setTxtProgressBar</span><span class="paren">(</span><span class="identifier">pb</span>, <span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="string">"large_sorted"</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="identifier">move_to</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">63</td>
+                    <td class="num">21</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                          <span class="identifier">title</span> <span class="operator">=</span> <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Hard Group By - %s"</span>, <span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">64</td>
+                    <td class="num">22</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="identifier">sleep</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">67</td>
+                    <td class="num">25</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">doprog2</span><span class="paren">(</span><span class="identifier">pt_begin_collate</span>, <span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">copy</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="literal">TRUE</span>, <span class="literal">FALSE</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">68</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">26</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"disk.frame::move_to ERROR: copy argument must be TRUE or FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Perform a hard group</span></pre>
+                      <pre class="language-r">  <span class="comment">## copy all files over</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">72</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">30</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r">  <span class="identifier">listfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">73</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">31</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' A hard_group_by is a group by that also reorganizes the chunks to ensure that</span></pre>
+                      <pre class="language-r">  <span class="identifier">shortlistfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">74</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">32</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' every unique grouping of `by`` is in the same chunk. Or in other words, every</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk2</span><span class="paren">(</span><span class="identifier">listfiles</span>, <span class="identifier">shortlistfiles</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">75</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">33</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' row that share the same `by` value will end up in the same chunk.</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">76</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">34</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_copy</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... grouping variables</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">78</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">36</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the out put directory</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param add same as dplyr::group_by</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .drop same as dplyr::group_by</span></pre>
+                      <pre class="language-r">  <span class="comment">## copy .metadata over</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">83</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">85</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
+                      <pre class="language-r">  <span class="identifier">metadata_path</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="string">".metadata"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">86</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sort_split_sample_size for the "sort" shardby function, if sort_splits is null, the number of rows to sample per chunk for random splits.</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">87</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">45</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="identifier">listfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">metadata_path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">88</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">46</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">  <span class="identifier">shortlistfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">metadata_path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">89</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">47</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' iris.df = as.disk.frame(iris, nchunks = 2)</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk2</span><span class="paren">(</span><span class="identifier">listfiles</span>, <span class="identifier">shortlistfiles</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">90</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">48</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">91</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">49</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # group_by iris.df by specifies and ensure rows with the same specifies are in the same chunk</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_copy</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">92</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' iris_hard.df = hard_group_by(iris.df, Species)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">93</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">51</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 1)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">95</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 2)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">96</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">97</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">98</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">56</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
+                      <pre class="language-r">    <span class="identifier">delete</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">99</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(iris_hard.df)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">100</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_group_by</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">101</td>
-                    <td class="coverage">55<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">59</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"hard_group_by"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">102</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">103</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">104</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname hard_group_by</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">105</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname move_to</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">106</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">107</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_group_by.data.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">copy_df_to</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">108</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">65</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">move_to</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">109</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/recommend_nchunks.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">110</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Recommend number of chunks based on input size</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">111</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname hard_group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description Computes the recommended number of chunks to break a data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">112</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
+                      <pre class="language-r"><span class="comment">#' into. It can accept filesizes in bytes (as integer) or a data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">113</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame or the file size in bytes of a CSV file holding the</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">114</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_group_by.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#'   data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">115</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param type only = "csv" is supported. It indicates the file type</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">116</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">...</span>, </pre>
+                      <pre class="language-r"><span class="comment">#'   corresponding to file size `df`</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">117</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_hard_group_by"</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param minchunks the minimum number of chunks. Defaults to the number of CPU</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">118</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#'   cores (without hyper-threading)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">119</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param conservatism a multiplier to the recommended number of chunks. The</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">120</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, </pre>
+                      <pre class="language-r"><span class="comment">#'   more chunks the smaller the chunk size and more likely that each chunk can</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">121</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, </pre>
+                      <pre class="language-r"><span class="comment">#'   fit into RAM</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">122</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param ram_size The amount of RAM available which is usually computed. Except on RStudio with R3.6+</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">123</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sort_split_sample_size</span><span class="operator">=</span><span class="number">100</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom pryr object_size</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">124</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom utils memory.limit</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">125</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">126</td>
-                    <td class="coverage">53<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom benchmarkme get_ram</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">127</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">128</td>
-                    <td class="coverage">53<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">ff</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">129</td>
-                    <td class="coverage">53<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"hash"</span>, <span class="string">"sort"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">130</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' # recommend nchunks based on data.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">131</td>
-                    <td class="coverage">53<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"sort"</span> <span class="operator">&amp;&amp;</span> <span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">sort_splits</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' recommend_nchunks(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">132</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># Sample enough per chunk to generate reasonable splits</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">133</td>
-                    <td class="coverage">7<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sample_size_per_chunk</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">/</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">*</span> <span class="identifier">sort_split_sample_size</span></pre>
+                      <pre class="language-r"><span class="comment">#' # recommend nchunks based on file size ONLY CSV is implemented at the moment</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">134</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' recommend_nchunks(1024^3)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">135</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># Sample and sort</span></pre>
+                      <pre class="language-r"><span class="identifier">recommend_nchunks</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span> <span class="operator">=</span> <span class="string">"csv"</span>, <span class="identifier">minchunks</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getDTthreads</span><span class="paren">(</span><span class="paren">)</span>, <span class="identifier">conservatism</span> <span class="operator">=</span> <span class="number">8</span>, <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">df_ram_size</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">136</td>
-                    <td class="coverage">7<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">map</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sample_n</span>, <span class="identifier">size</span><span class="operator">=</span><span class="identifier">sample_size_per_chunk</span>, <span class="identifier">replace</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">137</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">26</td>
+                    <td class="coverage">32<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">select</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
+                      <pre class="language-r">  <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">138</td>
-                    <td class="coverage">7<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">collect</span><span class="paren">(</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">139</td>
-                    <td class="coverage"></td>
+                    <td class="num">27</td>
+                    <td class="coverage">32<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">140</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># NSE</span></pre>
+                      <pre class="language-r">    <span class="comment"># the df's size in gigabytes</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">141</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">29</td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">object_size</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">142</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">30</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">143</td>
-                    <td class="coverage">7<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">31</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">arrange</span><span class="paren">(</span><span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">syms</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">144</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">32</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">type</span> <span class="operator">==</span> <span class="string">"csv"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">145</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">sort_splits_sample</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span></pre>
+                      <pre class="language-r">    <span class="comment"># assume that df is the estimated number of bytes of the data</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">146</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">34</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">arrange</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">df</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">147</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">36</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">dfsize</span> <span class="operator">=</span> <span class="identifier">df</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span><span class="operator">/</span><span class="number">1024</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">148</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">149</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># If 100 chunks, this return get 99 splits based on percentiles.</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">150</td>
-                    <td class="coverage">7<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ntiles</span> <span class="operator">&lt;-</span> <span class="identifier">round</span><span class="paren">(</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="operator">-</span><span class="number">1</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">*</span> <span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">sort_splits_sample</span><span class="paren">)</span> <span class="operator">/</span> <span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># ram_size = df_ram_size()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">151</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">152</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># Get splits. May lead to less than nchunks if duplicates are selected.</span></pre>
+                      <pre class="language-r">  <span class="comment"># the number physical cores not counting hyper threaded ones as 2; they are counted as 1</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">153</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">42</td>
+                    <td class="coverage">32<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">sort_splits</span> <span class="operator">&lt;-</span> <span class="identifier">sort_splits_sample</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">  <span class="identifier">nc</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getDTthreads</span><span class="paren">(</span><span class="paren">)</span> <span class="comment">#parallel::detectCores(logical = FALSE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">154</td>
-                    <td class="coverage">7<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">44</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">slice</span><span class="paren">(</span><span class="identifier">ntiles</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">155</td>
-                    <td class="coverage">7<em>x</em></td>
+                    <td class="num">45</td>
+                    <td class="coverage">32<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">distinct</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">max</span><span class="paren">(</span><span class="identifier">round</span><span class="paren">(</span><span class="identifier">dfsize</span><span class="operator">/</span><span class="identifier">ram_size</span><span class="operator">*</span><span class="identifier">conservatism</span><span class="paren">)</span><span class="operator">*</span><span class="identifier">nc</span>, <span class="identifier">minchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">156</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">157</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">158</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># test if the unlist it will error</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">159</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' Get the size of RAM in gigabytes</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">160</td>
-                    <td class="coverage">53<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">161</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># This will return the variable names</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return integer of RAM in gigabyte (GB)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">162</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">163</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># TODO use better ways to do NSE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom bit64 as.integer64.character</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">164</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># the below will fail if indeed ... can not be list-ed</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">165</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># there should be a better way to do this</span></pre>
+                      <pre class="language-r"><span class="comment">#' # returns the RAM size in gigabyte (GB)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">166</td>
-                    <td class="coverage">53<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' df_ram_size() </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">167</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">df_ram_size</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">168</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># shard and create temporary diskframes</span></pre>
+                      <pre class="language-r">  <span class="comment">#browser()</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">169</td>
-                    <td class="coverage">51<em>x</em></td>
+                    <td class="num">59</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp_df</span>  <span class="operator">=</span> <span class="identifier">map</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">170</td>
-                    <td class="coverage">230<em>x</em></td>
+                    <td class="num">60</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">tmpdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">171</td>
-                    <td class="coverage">230<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">61</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tmpdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># the amount of memory available in gigabytes</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">172</td>
-                    <td class="coverage">51<em>x</em></td>
+                    <td class="num">62</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">Sys.info</span><span class="paren">(</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="string">"sysname"</span><span class="paren">]</span><span class="paren">]</span> <span class="operator">==</span> <span class="string">"Windows"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">173</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">63</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="identifier">majorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">major</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">174</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="identifier">minorv</span> <span class="operator">=</span> <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">version</span><span class="operator">$</span><span class="identifier">minor</span>, <span class="string">"."</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">175</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># now rbindlist</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="paren">(</span><span class="identifier">majorv</span><span class="operator">&gt;=</span><span class="number">3</span> <span class="operator">&amp;</span> <span class="identifier">minorv</span> <span class="operator">&gt;=</span> <span class="number">6</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">majorv</span> <span class="operator">&gt;=</span> <span class="number">4</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">176</td>
-                    <td class="coverage">51<em>x</em></td>
+                    <td class="num">66</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">ram_size</span> <span class="operator">&lt;-</span> <span class="identifier">system</span><span class="paren">(</span><span class="string">"wmic MemoryChip get Capacity"</span>, <span class="identifier">intern</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">177</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">67</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">          <span class="identifier">map</span><span class="paren">(</span><span class="operator">~</span><span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">" "</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">178</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">68</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># clean up the tmp dir</span></pre>
+                      <pre class="language-r">          <span class="identifier">unlist</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">179</td>
-                    <td class="coverage">51<em>x</em></td>
+                    <td class="num">69</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="identifier">map</span><span class="paren">(</span><span class="operator">~</span><span class="identifier">bit64</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as.integer64.character</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">3</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">180</td>
-                    <td class="coverage">230<em>x</em></td>
+                    <td class="num">70</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="identifier">unlist</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">181</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">71</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="identifier">sum</span><span class="paren">(</span><span class="identifier">na.rm</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">182</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">183</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">73</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">memory.limit</span><span class="paren">(</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">184</td>
-                    <td class="coverage">51<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">74</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res1</span> <span class="operator">&lt;-</span> <span class="literal">NULL</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">185</td>
-                    <td class="coverage">51<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">75</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"character"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">186</td>
-                    <td class="coverage">51<em>x</em></td>
+                    <td class="num">76</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'res1 = chunk_group_by(res, {paste(by,collapse=",")})'</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.Platform</span><span class="operator">$</span><span class="identifier">GUI</span> <span class="operator">==</span> <span class="string">"RStudio"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">187</td>
+                    <td class="num">77</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">188</td>
+                    <td class="num">78</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res1</span> <span class="operator">=</span> <span class="identifier">res</span> <span class="operator">%&gt;%</span> <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">(</span><span class="paren">{</span><span class="paren">{</span><span class="identifier">by</span><span class="paren">}</span><span class="paren">}</span><span class="paren">)</span> </pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">189</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">"You are running RStudio with R 3.6+ on Windows. There is a bug with RAM size detection."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">190</td>
+                    <td class="num">79</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'res1 = chunk_group_by(res, {paste(by,collapse=",")})'</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">191</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">"And disk.frame can't determine your RAM size using manual methods."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">192</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">80</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">"Going to assume your RAM size is 16GB (gigabyte). The program will continue to run."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">193</td>
-                    <td class="coverage">51<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">81</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res1</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">194</td>
-                    <td class="coverage">53<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">82</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">195</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#message(e)</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">"Please report a bug at https://github.com/xiaodaigh/disk.frame/issues"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">196</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">84</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># This will return the variable names</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">"Include this in your bug report:"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">197</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">85</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="identifier">system</span><span class="paren">(</span><span class="string">"wmic MemoryChip get Capacity"</span>, <span class="identifier">intern</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">198</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">86</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">substr</span><span class="paren">(</span><span class="number">2</span>, <span class="identifier">nchar</span><span class="paren">(</span>.<span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">199</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">87</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">          <span class="identifier">message</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">200</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">          <span class="comment">#message("The option disk.frame.ram_size is not set. </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">201</td>
+                    <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">          <span class="comment">#message("To set the ram_size, do options(disk.frame_ram_size = your_ram_size_in_gigabytes)")</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">90</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="number">16</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">202</td>
+                    <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># shard and create temporary diskframes</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">203</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">92</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp_df</span>  <span class="operator">=</span> <span class="identifier">map</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">204</td>
+                    <td class="num">93</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">##browser</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">205</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">94</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">tmpdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">os</span> <span class="operator">=</span> <span class="identifier">R.version</span><span class="operator">$</span><span class="identifier">os</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">206</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">95</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tmpdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">grep</span><span class="paren">(</span><span class="string">"^darwin"</span>, <span class="identifier">os</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">207</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">96</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">substring</span><span class="paren">(</span><span class="identifier">system</span><span class="paren">(</span><span class="string">"sysctl hw.memsize"</span>, <span class="identifier">intern</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="number">13</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">208</td>
+                    <td class="num">97</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="comment">#else {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">209</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># now rbindlist</span></pre>
+                      <pre class="language-r">        <span class="comment"># This would work but is not allowed by CRAN</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">210</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">99</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">rbindlist.disk.frame</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="comment">#a = system('grep MemTotal /proc/meminfo', intern = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">211</td>
+                    <td class="num">100</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="comment">#}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">212</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">101</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># clean up the tmp dir</span></pre>
+                      <pre class="language-r">      <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">strsplit</span><span class="paren">(</span><span class="identifier">a</span>, <span class="string">" "</span><span class="paren">)</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">213</td>
-                    <td class="coverage">2<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">102</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk</span><span class="paren">(</span><span class="identifier">tmp_df</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">as.numeric</span><span class="paren">(</span><span class="identifier">l</span><span class="paren">[</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">l</span><span class="paren">)</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">214</td>
-                    <td class="coverage">12<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">103</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">l</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">215</td>
+                    <td class="num">104</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">216</td>
+                    <td class="num">105</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">217</td>
-                    <td class="coverage">2<em>x</em></td>
+                    <td class="num">106</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res1</span> <span class="operator">=</span> <span class="identifier">res</span> <span class="operator">%&gt;%</span> <span class="identifier">chunk_group_by</span><span class="paren">(</span><span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">syms</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">218</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">107</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"RAM size not detected. Assumme you have at least 16GB of RAM"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">108</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="number">16</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">219</td>
-                    <td class="coverage">2<em>x</em></td>
+                    <td class="num">109</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res1</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">220</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">110</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"RAM size not detected. Assumme you have at least 16GB of RAM"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">221</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">111</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="number">16</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/compute.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">112</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Compute without writing</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">113</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description </span></pre>
+                      <pre class="language-r">    <span class="comment"># assume at least 1G of RAM</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">114</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Perform the computation; same as calling map without .f and lazy = FALSE</span></pre>
+                      <pre class="language-r">    <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ram_size</span>, <span class="number">1</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">116</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">117</td>
+                    <td class="coverage">38<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite whether to overwrite or not</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">118</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param name Not used. Kept for compatibility with dplyr</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"benchmarkme"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">119</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... Not used. Kept for dplyr compatibility</span></pre>
+                      <pre class="language-r">      <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">benchmarkme</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_ram</span><span class="paren">(</span><span class="paren">)</span><span class="operator">/</span><span class="number">1024</span><span class="operator">^</span><span class="number">3</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">120</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">121</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr compute</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">122</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="string">"RAM size can't be determined. Assume you have 16GB of RAM."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">123</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="string">"Please report this error at github.com/xiaodaigh/disk.frame/issues"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">124</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df2 = cars.df %&gt;% map(~.x)</span></pre>
+                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Please include your operating system, R version, and if using RStudio the Rstudio version number"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">125</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # the computation is performed and the data is now stored elsewhere</span></pre>
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="number">16</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">126</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df3 = compute(cars.df2)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">127</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">        <span class="identifier">ram_size</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ram_size</span>, <span class="number">1</span>, <span class="identifier">na.rm</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">128</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="identifier">ram_size</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">129</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">130</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df3)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">131</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">compute.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">name</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_df_"</span>, <span class="identifier">fileext</span><span class="operator">=</span><span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"RAM size can't be determined. Assume you have 16GB of RAM."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">21</td>
-                    <td class="coverage">3<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">132</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"You can try to `install.packages('benchmarkme')` as that may help determine RAM size"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">133</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="number">16</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">134</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">3<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">135</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">136</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -16520,361 +20188,305 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/csv2disk.frame_readr.r" class="hidden">
+            <div id="R/overwrite_check.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#@importFrom readr DataFrameCallback</span></pre>
+                      <pre class="language-r"><span class="comment">#' Check if the outdir exists or not</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noMd</span></pre>
+                      <pre class="language-r"><span class="comment">#' If the overwrite is TRUE then the folder will be deleted, otherwise the folder will be created.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">csv_to_disk.frame_readr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">inmapfn</span> <span class="operator">=</span> <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">I</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">file.size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                              <span class="identifier">in_chunk_size</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">col_names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">delim</span><span class="operator">=</span><span class="string">","</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite TRUE or FALSE if `outdir`` exists and overwrite = FALSE then throw an error</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">6</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">8</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># TODO check header</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">11</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">in_chunk_size</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' tf = tempfile()</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">12</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' overwrite_check(tf, overwrite = FALSE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">13</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' overwrite_check(tf, overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">as.disk.frame</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">15</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">inmapfn</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' fs::dir_delete(tf)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">17</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, </pre>
+                      <pre class="language-r"><span class="identifier">overwrite_check</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">18</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, </pre>
+                      <pre class="language-r">  <span class="comment">##browser</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">19</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">826<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,</pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">20</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">...</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"outdir is NULL; no overwrite check is performed"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">21</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">NULL</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">24</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">826<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">shard</span><span class="paren">(</span><span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">418<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The directory is {outdir} is not a disk.frame folder. Execution has stopped to prevent accidental deletion of potentially important files"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">27</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">417<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">tmp_dir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">!=</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">tmp_dir</span>, <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df_tmp</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">tmp_dir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">31</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">f</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">pos</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">32</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df_tmp</span>, <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">33</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">34</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">35</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"csv_to_disk.frame reader backend: Stage 1/1 -- reading file"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">36</td>
+                    <td class="num">33</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim_chunked</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="identifier">f</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,  <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Failed to delete the directory {outdir} in preparation for overwrite, this could be due to many reason and may be a genuine bug. Firstly, though, please ensure you do not have the folder open by Explorer (Windows) or other file management systems"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">38</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"csv_to_disk.frame reader backend: Stage 2/2 -- performing shardby {shardby}"</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">39</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df_tmp</span>,<span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>,<span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">40</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df_tmp</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">f</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">pos</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">add_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">inmapfn</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">417<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_delim_chunked</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">readr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">SideEffectChunkCallback</span><span class="operator">$</span><span class="identifier">new</span><span class="paren">(</span><span class="identifier">f</span><span class="paren">)</span>, <span class="identifier">chunk_size</span> <span class="operator">=</span> <span class="identifier">in_chunk_size</span>,  <span class="identifier">delim</span> <span class="operator">=</span> <span class="identifier">delim</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">408<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">==</span> <span class="literal">FALSE</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">48</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"overwrite  = FALSE and outdir '{outdir}' already exists"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">406<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -16883,21 +20495,21 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/full_join.r" class="hidden">
+            <div id="R/inner_join.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -16925,7 +20537,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' join.df = full_join(cars.df, cars.df, merge_by_chunk_id = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' join.df = inner_join(cars.df, cars.df, merge_by_chunk_id = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -16960,12 +20572,12 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">full_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_full_join"</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">merge_by_chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">inner_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_inner_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">12</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
@@ -16979,7 +20591,7 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">14</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
@@ -17000,258 +20612,349 @@ <h2>disk.frame coverage - 51.96%</h2>
                   </tr>
                   <tr class="covered">
                     <td class="num">17</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">18</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># full join cannot be support for y in data.frame</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">19</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">20</td>
+                    <td class="coverage">12<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">22</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">26</td>
+                    <td class="coverage">12<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">27</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dy</span> <span class="operator">=</span> <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">ncx</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">21</td>
+                    <td class="num">28</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">dx</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">22</td>
+                    <td class="num">29</td>
+                    <td class="coverage">16<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">inner_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">30</td>
+                    <td class="coverage">16<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">31</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">full_join.disk.frame</span><span class="paren">(</span><span class="identifier">dx</span>, <span class="identifier">dy</span>, <span class="identifier">by</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="identifier">copy</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">23</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">32</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">24</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">34</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">25</td>
+                    <td class="num">35</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">27</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">37</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">28</td>
+                    <td class="num">38</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">41</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">42</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="num">43</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">34</td>
+                    <td class="num">44</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">35</td>
+                    <td class="num">45</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">36</td>
+                    <td class="num">46</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">inner_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">37</td>
+                    <td class="num">47</td>
                     <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">full_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">48</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">dotdotdot</span> <span class="operator">&lt;-</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">50</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map2</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">37<em>x</em></td>
+                    <td class="num">51</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">41</td>
+                    <td class="num">52</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">37<em>x</em></td>
+                    <td class="num">53</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">43</td>
+                    <td class="num">54</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="comment">#inner_join(.x, .y, by = by, copy = copy, ..., overwrite = overwrite)</span></pre>
+                    </td>
+                  </tr>
                   <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">37<em>x</em></td>
+                    <td class="num">57</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">full_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">lij</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">lift</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">inner_join</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">58</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">lij</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">.x</span>, <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="num">59</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">50</td>
+                    <td class="num">63</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
                       <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -17260,245 +20963,245 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/is_disk.frame.r" class="hidden">
+            <div id="R/collect.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Checks if a folder is a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into R</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame or directory to check </span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into RAM by loading the data and running all lazy</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' operations as data.table/data.frame or as a list</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param parallel if TRUE the collection is performed in parallel. By default</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' is_disk.frame(cars) # FALSE</span></pre>
+                      <pre class="language-r"><span class="comment">#'   if there are delayed/lazy steps then it will be parallel, otherwise it will</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' is_disk.frame(cars.df) # TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#'   not be in parallel. This is because parallel requires transferring data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#'   from background R session to the current R session and if there is no</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#'   computation then it's better to avoid transferring data between session,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   hence parallel = FALSE is a better choice</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">is_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">##browser</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table as.data.table</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">792<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom furrr future_map_dfr future_options</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">15</td>
-                    <td class="coverage">29<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_dfr</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">763<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="string">"character"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># character then check the path</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr collect select mutate</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">17</td>
-                    <td class="coverage">324<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return collect return a data.frame/data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">20</td>
-                    <td class="coverage">468<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span>, <span class="identifier">all</span>  <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # use collect to bring the data into RAM as a data.table/data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># if all files are fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">22</td>
-                    <td class="coverage">468<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">23</td>
-                    <td class="coverage">32<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">files</span>, <span class="operator">~</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">grep</span><span class="paren">(</span><span class="identifier">glob2rx</span><span class="paren">(</span><span class="string">"*.fst"</span><span class="paren">)</span>, <span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># some of the fiels do not have a .fst extension</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">25</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname collect</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">collect.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"lazyfn"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">78<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="identifier">cids</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">29</td>
-                    <td class="coverage">467<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dirs</span> <span class="operator">=</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"directory"</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment">#cids = as.integer(get_chunk_ids(x))</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage">467<em>x</em></td>
+                    <td class="coverage">78<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">31</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">75<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">32</td>
-                    <td class="coverage">467<em>x</em></td>
+                    <td class="coverage">30<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map_dfr</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">33</td>
-                    <td class="coverage">13<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">substr</span><span class="paren">(</span><span class="identifier">dirs</span>, <span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span><span class="operator">-</span><span class="number">8</span>,<span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">!=</span> <span class="string">".metadata"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">34</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">45<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -17512,21 +21215,21 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">37</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">38</td>
-                    <td class="coverage">467<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">return</span><span class="paren">(</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -17543,3185 +21246,3173 @@ <h2>disk.frame coverage - 51.96%</h2>
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/dplyr_verbs.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Create dplyr function for disk.frame</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' A function to make it easier to create functions like \code{filter}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' filter = create_dplyr_mapper(dplyr::filter)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
-                    </td>
-                  </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' #' example: creating a function that keeps only the first and last n row</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param simplify Should the result be simplified to array</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' first_and_last &lt;- function(chunk, n, ...) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   nr = nrow(chunk)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname collect</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   print(nr-n+1:nr)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return collect_list returns a list</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   chunk[c(1:n, (nr-n+1):nr), ]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' }</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' #' create the function for use with disk.frame</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' first_and_last_df = create_dplyr_mapper(first_and_last)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # returns the result as a list</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' mtcars.df = as.disk.frame(mtcars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect_list(cmap(cars.df, ~1))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' #' the operation is lazy</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' lazy_mtcars.df = mtcars.df %&gt;%</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   first_and_last_df(2)</span></pre>
+                      <pre class="language-r"><span class="identifier">collect_list</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">simplify</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"lazyfn"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="identifier">cids</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' #' bring into R</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(lazy_mtcars.df)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">27</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">28</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">58</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' #' clean up</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">&lt;-</span> <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">29</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(mtcars.df)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="comment">#res = furrr::future_map(1:nchunks(x), ~get_chunk(x, .x))</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">31</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">61</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param dplyr_fn The dplyr function to create a mapper for</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">32</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">62</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param warning_msg The warning message to display when invoking the mapper</span></pre>
+                      <pre class="language-r">        <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param as.data.frame force the input chunk of a data.frame; needed for dtplyr</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom rlang enquos quo</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">35</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">create_dplyr_mapper</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">dplyr_fn</span>, <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">as.data.frame</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">37</td>
+                    <td class="num">67</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">return_func</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">simplify</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">82<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">68</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">simplify2array</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">69</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">3<em>x</em></td>
+                    <td class="num">70</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">82<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">73</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">list</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># this is designed to capture any global stuff</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">82<em>x</em></td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/make_glm_streaming_fn.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getGlobalsAndPackages</span><span class="paren">(</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' A streaming function for speedglm</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">82<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data_for_eval_tidy</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' Define a function that can be used to feed data into speedglm and biglm</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">82<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">375<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">this_env</span> <span class="operator">=</span> <span class="identifier">environment</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param data a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' @param verbose Whether to print the status of data loading. Default to FALSE</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">51</td>
-                    <td class="coverage">375<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">for</span><span class="paren">(</span><span class="identifier">i</span> <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return return a function, fn, that can be used as the data argument in biglm::bigglm or speedglm::shglm</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">53</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">assign</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span>, <span class="identifier">data_for_eval_tidy</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span>, <span class="identifier">pos</span> <span class="operator">=</span> <span class="identifier">this_env</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @family Machine Learning (ML)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">375<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">lapply</span><span class="paren">(</span><span class="identifier">quo_dotdotdot</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">58</td>
-                    <td class="coverage">500<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">".Environment"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">this_env</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' streamacq = make_glm_streaming_fn(cars.df, verbose = FALSE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">61</td>
-                    <td class="coverage">375<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">as.data.frame</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' majorv = as.integer(version$major)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">375<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="string">"grouped_df"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' minorv = as.integer(strsplit(version$minor, ".", fixed=TRUE)[[1]][1])</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">63</td>
-                    <td class="coverage">42<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">dplyr_fn</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' if(((majorv == 3) &amp; (minorv &gt;= 6)) | (majorv &gt; 3)) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   m = biglm::bigglm(dist ~ speed, data = streamacq)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">333<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">dplyr_fn</span><span class="paren">(</span><span class="identifier">as.data.frame</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   summary(m)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'   predict(m, get_chunk(cars.df, 1))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   predict(m, collect(cars.df, 1))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">68</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">dplyr_fn</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' } else {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'   m = speedglm::shglm(dist ~ speed, data = streamacq)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># ZJ: we need both approaches. TRUST ME</span></pre>
+                      <pre class="language-r"><span class="identifier">make_glm_streaming_fn</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">verbose</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">72</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">28</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO better NSE at some point</span></pre>
+                      <pre class="language-r">  <span class="identifier">i</span> <span class="operator">=</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#tryCatch({</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">74</td>
-                    <td class="coverage">375<em>x</em></td>
+                    <td class="num">30</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">chunkids</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">75</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#}, error = function(e) {</span></pre>
+                      <pre class="language-r">  <span class="identifier">is</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">chunkids</span><span class="paren">)</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">76</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment"># if the previous failed</span></pre>
+                      <pre class="language-r">  <span class="identifier">verbose</span> <span class="operator">=</span> <span class="identifier">verbose</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">77</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#  eval(parse(text=rlang::as_label(code)), envir = this_env)</span></pre>
+                      <pre class="language-r">  <span class="identifier">nchunks_copy</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">chunkids</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#})</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">79</td>
-                    <td class="coverage">82<em>x</em></td>
+                    <td class="num">35</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">function</span><span class="paren">(</span><span class="identifier">reset</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">80</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">41<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">reset</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">81</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">37</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">return_func</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">verbose</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">82</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">38</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="string">"disk.frame stream has been reset; next read will be from beginning"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">83</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' The dplyr verbs implemented for disk.frame</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">85</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description </span></pre>
+                      <pre class="language-r">      <span class="identifier">i</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="number">0</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">86</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Please see the dplyr document for their usage. Please note that `group_by`</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">87</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">35<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' and `arrange` performs the actions within each chunk</span></pre>
+                      <pre class="language-r">      <span class="identifier">i</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">88</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">89</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">45</td>
+                    <td class="coverage">35<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select rename filter mutate transmute arrange do groups group_by group_by glimpse summarise</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">i</span> <span class="operator">&gt;</span> <span class="identifier">nchunks_copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">90</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... Same as the dplyr functions</span></pre>
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="literal">NULL</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">91</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .data a disk.frame</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">92</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">30<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">verbose</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">93</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">49</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family dplyr verbs</span></pre>
+                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"streaming: {i}/{nchunks_copy}; chunk id: {chunkids[i]}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">95</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">30<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' library(dplyr)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">chunkids</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">96</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' library(magrittr)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">97</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">98</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' mult = 2</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/srckeep.disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">99</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' Keep only the variables from the input listed in selections</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">100</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # use all any of the supported dplyr</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">101</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2 = cars.df %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param selections The list of variables to keep from the input source</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">102</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   select(speed) %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not yet used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">103</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   mutate(speed2 = speed * mult) %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">104</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   filter(speed &lt; 50) %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">105</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   rename(speed1 = speed) %&gt;% </span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">106</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   collect</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">107</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # when loading cars's chunks into RAM, load only the column speed</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">108</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(srckeep(cars.df, "speed"))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">109</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">110</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">select.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">111</td>
-                    <td class="coverage">12<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">112</td>
-                    <td class="coverage">12<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">map</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="operator">~</span><span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">113</td>
-                    <td class="coverage">62<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">114</td>
-                    <td class="coverage">62<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">115</td>
-                    <td class="coverage">12<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">116</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">117</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="identifier">srckeep</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">selections</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">118</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">15</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">119</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">16</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"keep"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">selections</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">120</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">121</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">18</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  <span class="identifier">df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">122</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rename.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">123</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">124</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunks The chunks to load</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">125</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname srckeep</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">126</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">127</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">filter.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">srckeepchunks</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunks</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">128</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">25</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">129</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="comment"># TODO relax this</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">130</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">27</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is.integer</span><span class="paren">(</span><span class="identifier">chunks</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">131</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">132</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">29</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_all</span></pre>
+                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"keep_chunks"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">chunks</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">30</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">133</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">filter_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/chunk_mapper.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">134</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Create function that applies to each chunk if disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">135</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">136</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' A function to make it easier to create functions like \code{filter}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">137</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">138</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_if</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">139</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">filter_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">140</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' filter = create_chunk_mapper(dplyr::filter)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">141</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">142</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' #' example: creating a function that keeps only the first and last n row</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">143</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' first_and_last &lt;- function(chunk, n, ...) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">144</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr filter_at</span></pre>
+                      <pre class="language-r"><span class="comment">#'   nr = nrow(chunk)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">145</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">filter_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">filter_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   print(nr-n+1:nr)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">146</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#'   chunk[c(1:n, (nr-n+1):nr), ]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">147</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">148</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">149</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' #' create the function for use with disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">150</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future getGlobalsAndPackages</span></pre>
+                      <pre class="language-r"><span class="comment">#' first_and_last_df = create_chunk_mapper(first_and_last)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">151</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom rlang eval_tidy quo enquos</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">152</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate</span></pre>
+                      <pre class="language-r"><span class="comment">#' mtcars.df = as.disk.frame(mtcars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">153</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">mutate.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">154</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' #' the operation is lazy</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">155</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' lazy_mtcars.df = mtcars.df %&gt;%</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">156</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#'   first_and_last_df(2)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">157</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr transmute</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">158</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' #' bring into R</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">159</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">transmute.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">transmute</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(lazy_mtcars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">160</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">161</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' #' clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">162</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(mtcars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">163</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">164</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk_fn The dplyr function to create a mapper for</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">165</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">arrange.disk.frame</span> <span class="operator">=</span><span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span>, <span class="identifier">warning_msg</span><span class="operator">=</span><span class="string">"`arrange.disk.frame` is now deprecated. Please use `chunk_arrange` instead. This is in preparation for a more powerful `arrange` that sorts the whole disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param warning_msg The warning message to display when invoking the mapper</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">166</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param as.data.frame force the input chunk of a data.frame; needed for dtplyr</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">167</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom rlang enquos quo</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">168</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">169</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
+                      <pre class="language-r"><span class="identifier">create_chunk_mapper</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk_fn</span>, <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">as.data.frame</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">170</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  <span class="identifier">return_func</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">171</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_arrange</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">172</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">warning_msg</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">173</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">174</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">175</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr tally</span></pre>
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">74<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">176</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">177</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">tally.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">tally</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># this is designed to capture any global stuff</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">74<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">vars_and_pkgs</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">getGlobalsAndPackages</span><span class="paren">(</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">178</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">data_for_eval_tidy</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">179</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">180</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">181</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr count</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">182</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="identifier">this_env</span> <span class="operator">=</span> <span class="identifier">environment</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">183</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">count.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">count</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">184</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">53</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">185</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">54</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># TODO family is not required is group-by</span></pre>
+                      <pre class="language-r">        <span class="keyword">for</span><span class="paren">(</span><span class="identifier">i</span> <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">186</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># TODO alot of these .disk.frame functions are not generic</span></pre>
+                      <pre class="language-r">          <span class="identifier">assign</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">data_for_eval_tidy</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span>, <span class="identifier">data_for_eval_tidy</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span>, <span class="identifier">pos</span> <span class="operator">=</span> <span class="identifier">this_env</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">187</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">188</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">189</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">190</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr add_count</span></pre>
+                      <pre class="language-r">      <span class="identifier">lapply</span><span class="paren">(</span><span class="identifier">quo_dotdotdot</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">191</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">428<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">        <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">".Environment"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">this_env</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">192</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">add_count.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_count</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">193</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">194</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">63</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">as.data.frame</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">195</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="string">"grouped_df"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">196</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr add_tally</span></pre>
+                      <pre class="language-r">          <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">chunk_fn</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">197</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">198</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">67</td>
+                    <td class="coverage">309<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">add_tally.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">add_tally</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">chunk_fn</span><span class="paren">(</span><span class="identifier">as.data.frame</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">199</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">200</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">201</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">70</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo</span><span class="paren">(</span><span class="identifier">chunk_fn</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">202</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">203</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">204</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarize</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment"># ZJ: we need both approaches. TRUST ME</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">205</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment"># TODO better NSE at some point need dist</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">206</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">75</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">207</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">76</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">208</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">77</td>
+                    <td class="coverage">327<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">209</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">78</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">        <span class="identifier">as_label_code</span> <span class="operator">=</span> <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_label</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">210</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">79</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarise</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">as_label_code</span> <span class="operator">==</span> <span class="string">"chunk_fn(...)"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">211</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">80</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">          <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"disk.frame has detected a syntax error in \n\n`{code}`\n\n. If you believe your syntax is correct, raise an issue at https://github.com/xiaodaigh/disk.frame with a MWE"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">212</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">213</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">          <span class="comment"># likely to be dealing with data.tables</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">214</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span><span class="operator">=</span><span class="identifier">as_label_code</span><span class="paren">)</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">this_env</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">215</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">216</td>
+                    <td class="num">85</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">summarize.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize</span>, <span class="identifier">warning_msg</span><span class="operator">=</span><span class="string">"`summarize.disk.frame` is now deprecated. Please use `chunk_summarize` instead. This is in preparation for a more powerful `group_by` framework"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">217</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">86</td>
+                    <td class="coverage">74<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#function(...) {</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">218</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#stop("`summarize.disk.frame` has been removed. Please use `chunk_summarize` instead. This is in preparation for a more powerful `group_by` framework")</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">219</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">88</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#}</span></pre>
+                      <pre class="language-r">  <span class="identifier">return_func</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">220</td>
+                    <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/anti_join.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">221</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param by join by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">222</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param copy same as dplyr::anti_join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">223</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id the merge is performed by chunk id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">224</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">225</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">summarise.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise</span>, <span class="identifier">warning_msg</span><span class="operator">=</span><span class="string">"`summarise.disk.frame` is now deprecated. Please use `chunk_summarise` instead. This is in preparation for a more powerful `group_by` framework"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .progress Show progress or not. Defaults to FALSE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">226</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#function(...) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... same as dplyr's joins</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">227</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   stop("`summarise.disk.frame` has been removed. Please use `chunk_summarise` instead. This is in preparation for a more powerful `group_by` framework")</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">228</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># }</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom rlang quo enquos</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">229</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr anti_join left_join full_join semi_join inner_join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">230</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @return disk.frame or data.frame/data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">231</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">232</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">233</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr do</span></pre>
+                      <pre class="language-r"><span class="comment">#' df.df = as.disk.frame(data.frame(x = 1:3, y = 4:6), overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">234</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">do.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' df2.df = as.disk.frame(data.frame(x = 1:2, z = 10:11), overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">235</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">236</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' anti_joined.df = anti_join(df.df, df2.df) </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">237</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">238</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' anti_joined.df %&gt;% collect</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">239</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_all</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">240</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">group_by_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' anti_joined.data.frame = anti_join(df.df, data.frame(x = 1:2, z = 10:11))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">241</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">242</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">243</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(df.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">244</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(df2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">245</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_at</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(anti_joined.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">246</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">group_by_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">anti_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_anti_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">247</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">248</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">28</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">249</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">250</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">30</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">251</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr group_by_if</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">252</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">group_by_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">253</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">254</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">cmap_dfr.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">255</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">anti_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">256</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">257</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_all</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">258</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">mutate_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">259</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">260</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">40</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">261</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">262</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">42</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">263</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_at</span></pre>
+                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">264</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">mutate_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">265</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">266</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">267</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">268</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">269</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr mutate_if</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">270</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">mutate_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">mutate_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">53</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">anti_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">271</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">272</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">273</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="comment">#res = cmap2(x, y, ~{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">274</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">275</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">58</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_all</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">276</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rename_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">277</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">60</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">278</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">279</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">62</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">anti_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="keyword">...</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">280</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">63</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">281</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_at</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">282</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rename_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">283</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">284</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">67</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">285</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">286</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">287</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr rename_if</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/rbindlist.disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">288</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rename_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">rename_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' rbindlist disk.frames together</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">289</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param df_list A list of disk.frames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">290</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir Output directory of the row-bound disk.frames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">291</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param by_chunk_id If TRUE then only the chunks with the same chunk IDs will be bound</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">292</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param parallel if TRUE then bind multiple disk.frame simultaneously, Defaults to TRUE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">293</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_all</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress 0-100, 100 being the highest compression rate.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">294</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">select_all.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">295</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">296</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">297</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table setDT</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">298</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">299</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_at</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_chr map_dfr map map_lgl</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">300</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">select_at.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">301</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">302</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">303</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">304</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">305</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr select_if</span></pre>
+                      <pre class="language-r"><span class="comment">#' # row-bind two disk.frames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">306</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">select_if.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">select_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2.df = rbindlist.disk.frame(list(cars.df, cars.df))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">307</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">308</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">309</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">310</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">311</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise_all</span></pre>
+                      <pre class="language-r"><span class="identifier">rbindlist.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">312</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">25</td>
+                    <td class="coverage">53<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarise_all</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">df_list</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"list"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">313</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">314</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">27</td>
+                    <td class="coverage">53<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">315</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">316</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">29</td>
+                    <td class="coverage">53<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">317</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">30</td>
+                    <td class="coverage">233<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarise_at</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">318</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarise_at</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarise_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"error running rbindlist.disk.frame: Not every element of df_list is a disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">319</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">320</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">321</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">52<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">by_chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">322</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    <span class="identifier">list_of_paths</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_chr</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="operator">~</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">323</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize</span></pre>
+                      <pre class="language-r">    <span class="identifier">list_of_chunks</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">list_of_paths</span>, <span class="operator">~</span><span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>,<span class="identifier">full_path</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">324</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarize</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">list_of_chunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">325</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">326</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="comment"># split the list of chunks into lists for easy operation with future</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">327</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">slist</span> <span class="operator">=</span> <span class="identifier">split</span><span class="paren">(</span><span class="identifier">list_of_chunks</span><span class="operator">$</span><span class="identifier">full_path</span>,<span class="identifier">list_of_chunks</span><span class="operator">$</span><span class="identifier">path</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">328</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">329</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_all</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">330</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarize_all</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_all</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment">#system.time(future.apply::future_lapply(1:length(slist), function(i) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">331</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">45</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">332</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"Appending disk.frames: "</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">333</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">334</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="identifier">system.time</span><span class="paren">(</span><span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">335</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_at</span></pre>
+                      <pre class="language-r">        <span class="identifier">full_paths1</span> <span class="operator">=</span> <span class="identifier">slist</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">336</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">50</td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarize_at</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_at</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">outfilename</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">337</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">full_paths1</span>, <span class="operator">~</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span>,<span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>,<span class="identifier">outfilename</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">338</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">339</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">53</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">340</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">341</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr summarize_if</span></pre>
+                      <pre class="language-r">      <span class="identifier">system.time</span><span class="paren">(</span><span class="identifier">lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">342</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">56</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_summarize_if</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">summarize_if</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">full_paths1</span> <span class="operator">=</span> <span class="identifier">slist</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">343</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">57</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">outfilename</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">344</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">58</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">full_paths1</span>, <span class="operator">~</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span>,<span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>,<span class="identifier">outfilename</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">345</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">59</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">346</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">347</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr distinct</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">348</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">distinct.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">349</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">63</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">stop</span><span class="paren">(</span><span class="string">"`distinct.disk.frame` is not available. Please use `chunk_distinct`"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">rbind_res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">350</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">351</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">shardkeys</span> <span class="operator">&lt;-</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="identifier">shardkey</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">352</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">353</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="comment"># if all the sharkeys are identical then</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">354</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">    <span class="comment">##browser</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">355</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr distinct</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">shardkeys</span><span class="paren">[</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span>, <span class="operator">~</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">356</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">70</td>
+                    <td class="coverage">52<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">rbind_res</span>, </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">71</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_distinct</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">distinct</span>, <span class="identifier">warning_msg</span> <span class="operator">=</span> <span class="string">"the `distinct` function applies distinct chunk-wise"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">               <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="operator">$</span><span class="identifier">shardkey</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">357</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">72</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">               <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="operator">$</span><span class="identifier">shardchunks</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">358</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">73</td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' The shard keys of the disk.frame</span></pre>
+                      <pre class="language-r">               <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">359</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return character</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">360</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">75</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">rbind_res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">361</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">362</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">groups.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">363</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">78</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"For rbindlist.disk.frame, only by_chunk_id = TRUE is implemented"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">364</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">365</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/foverlaps.disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">366</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Group by within each disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' Apply data.table's foverlaps to the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">367</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description EXPERIMENTAL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">368</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' The disk.frame group by operation perform group WITHIN each chunk. This is</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df1 A disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">369</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' often used for performance reasons. If the user wishes to perform group-by,</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df2 A disk.frame or a data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">370</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' they may choose to use the `hard_group_by` function which is expensive as it</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param by.x character/string vector. by.x used in foverlaps</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">371</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' reorganizes the chunks by the shard key.</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param by.y character/string vector. by.x used in foverlaps</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">372</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @seealso hard_group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir The output directory of the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">373</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .data a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id If TRUE then the merges will happen for chunks in df1 and df2 with the same chunk id which speed up processing. Otherwise every chunk of df1 is merged with every chunk of df2. Ignored with df2 is not a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">374</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... same as the dplyr::group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress The compression ratio for fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">375</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite existing directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">376</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to data.table::foverlaps and disk.frame::cmap.disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">377</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">378</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># TODO check shardkey</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">379</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># group_by.disk.frame &lt;- function(.data, ...) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table foverlaps data.table setDT setkeyv</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">380</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   dplyr_fn = dplyr::group_by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">381</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">382</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   quo_dotdotdot = rlang::enquos(...)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">383</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   </span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">384</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   # this is designed to capture any global stuff</span></pre>
+                      <pre class="language-r"><span class="comment">#' library(data.table)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">385</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   vars_and_pkgs = future::getGlobalsAndPackages(quo_dotdotdot)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">386</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   data_for_eval_tidy = force(vars_and_pkgs$globals)</span></pre>
+                      <pre class="language-r"><span class="comment">#' ## simple example:</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">387</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   </span></pre>
+                      <pre class="language-r"><span class="comment">#' x = as.disk.frame(data.table(start=c(5,31,22,16), end=c(8,50,25,18), val2 = 7:10))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">388</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   res = map(.data, ~{</span></pre>
+                      <pre class="language-r"><span class="comment">#' y = as.disk.frame(data.table(start=c(10, 20, 30), end=c(15, 35, 45), val1 = 1:3))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">389</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     this_env = environment()</span></pre>
+                      <pre class="language-r"><span class="comment">#' byxy = c("val1", "start", "end")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">390</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     </span></pre>
+                      <pre class="language-r"><span class="comment">#' xy.df = foverlaps.disk.frame(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">391</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     if(length(data_for_eval_tidy) &gt; 0) {</span></pre>
+                      <pre class="language-r"><span class="comment">#'   x, y, by.x = byxy, by.y = byxy, </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">392</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#       for(i in 1:length(data_for_eval_tidy)) {</span></pre>
+                      <pre class="language-r"><span class="comment">#'   merge_by_chunk_id = TRUE, overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">393</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#         assign(names(data_for_eval_tidy)[i], data_for_eval_tidy[[i]], pos = this_env)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">394</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#       }</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">395</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     }</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(x)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">396</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     </span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(y)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">397</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     lapply(quo_dotdotdot, function(x) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(xy.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">398</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#       attr(x, ".Environment") = this_env</span></pre>
+                      <pre class="language-r"><span class="identifier">foverlaps.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">df2</span>, <span class="identifier">by.x</span> <span class="operator">=</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span> <span class="keyword">else</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="identifier">by.y</span> <span class="operator">=</span> <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="keyword">...</span>,<span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"df_foverlaps_tmp"</span>, <span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">399</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     })</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">400</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">35</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     </span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">401</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     code = rlang::quo(dplyr_fn(.x, !!!quo_dotdotdot))</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">402</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">37</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#     eval(parse(text=rlang::as_label(code)), envir = this_env)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">403</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#   }, lazy = TRUE)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">404</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">39</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># }</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">405</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">40</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#group_by.disk.frame &lt;- create_dplyr_mapper(dplyr::group_by, warning_msg = "The group_by operation is applied WITHIN each chunk, hence the results may not be as expected. To address this issue, you can rechunk(df, shardby = your_group_keys) which can be computationally expensive. Otherwise, you may use a second stage summary to obtain the desired result.")</span></pre>
+                      <pre class="language-r">    <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="operator">~</span><span class="identifier">foverlaps</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">df2</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">406</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">group_by.disk.frame</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span>, <span class="identifier">warning_msg</span><span class="operator">=</span><span class="string">"`group_by.disk.frame` is now deprecated. Please use `chunk_group_by` instead. This is in preparation for a more powerful `group_by` framework"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">|</span> <span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df1</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">df2</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">407</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#function(...) {</span></pre>
+                      <pre class="language-r">    <span class="comment"># if the shardkeys are the same then only need to match by segment id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">408</td>
+                    <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#stop("`arrange.disk.frame` has been removed. Please use `chunk_arrange` instead. This is preparation for a more powerful `group_by` framework")</span></pre>
+                      <pre class="language-r">    <span class="comment"># as account with the same shardkey must end up in the same segment</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">409</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">44</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#}</span></pre>
+                      <pre class="language-r">    <span class="identifier">path1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df1</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">410</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">45</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df2</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">411</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">412</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">47</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">df3</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">413</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">48</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname group_by</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">414</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">49</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">chunk_group_by</span> <span class="operator">&lt;-</span> <span class="identifier">create_dplyr_mapper</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">group_by</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">415</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">50</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">pathA</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">416</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">51</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">file_id</span> <span class="operator">=</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">417</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname dplyr_verbs</span></pre>
+                      <pre class="language-r">      <span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">418</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">53</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">glimpse.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">419</td>
+                    <td class="num">54</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">glimpse</span><span class="paren">(</span><span class="identifier">head</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="keyword">...</span><span class="paren">)</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">420</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">pathB</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">421</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">422</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">57</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Internal methods</span></pre>
+                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"chunk_id"</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">423</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># @param .data the data</span></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">424</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">59</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># @param cmd the function to record</span></pre>
+                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">425</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">record</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="identifier">cmd</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">426</td>
+                    <td class="num">61</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>,<span class="string">"lazyfn"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.data</span>,<span class="string">"lazyfn"</span><span class="paren">)</span>, <span class="identifier">list</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">427</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">62</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">.data</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">428</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">63</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">row</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">429</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="comment">#future.apply::future_lapply(1:nrow(df3), function(row) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">430</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># Internal methods</span></pre>
+                      <pre class="language-r">    <span class="comment">#lapply(1:nrow(df3), function(row) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">431</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">66</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># @param .data the disk.frame</span></pre>
+                      <pre class="language-r">      <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">df3</span><span class="paren">[</span><span class="identifier">row</span>, <span class="identifier">chunk_id</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">432</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># @param cmds the list of function to play back</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">433</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">68</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">play</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.data</span>, <span class="identifier">cmds</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">data1</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df1</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">434</td>
-                    <td class="coverage">427<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">69</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">for</span> <span class="paren">(</span><span class="identifier">cmd</span> <span class="keyword">in</span> <span class="identifier">cmds</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">data2</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df2</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">435</td>
-                    <td class="coverage">526<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">70</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">436</td>
+                    <td class="num">71</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.data</span> <span class="operator">&lt;-</span> <span class="identifier">cmd</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">437</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">72</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">438</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># create a temporary environment </span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">439</td>
-                    <td class="coverage">526<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">74</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">an_env</span> <span class="operator">=</span> <span class="identifier">new.env</span><span class="paren">(</span><span class="identifier">parent</span> <span class="operator">=</span> <span class="identifier">environment</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">setkeyv</span><span class="paren">(</span><span class="identifier">data2</span>, <span class="identifier">by.y</span><span class="paren">[</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by.y</span><span class="paren">)</span><span class="operator">-</span><span class="number">2</span><span class="operator">+</span><span class="number">1</span><span class="paren">)</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">by.y</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">440</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">441</td>
-                    <td class="coverage">526<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">76</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">ng</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">dotdotdot</span><span class="operator">$</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">data1</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">442</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">77</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">      <span class="identifier">dotdotdot</span><span class="operator">$</span><span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">data2</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">443</td>
-                    <td class="coverage">526<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">78</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">ng</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">data3</span> <span class="operator">=</span> <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">foverlaps</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">444</td>
-                    <td class="coverage">442<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">79</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">for</span><span class="paren">(</span><span class="identifier">i</span> <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span>; <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">445</td>
-                    <td class="coverage">1567<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">80</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">g</span> <span class="operator">=</span> <span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">vars_and_pkgs</span><span class="operator">$</span><span class="identifier">globals</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
+                      <pre class="language-r">      <span class="identifier">outdir</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">446</td>
-                    <td class="coverage">1567<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">81</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">assign</span><span class="paren">(</span><span class="identifier">ng</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span>, <span class="identifier">g</span>, <span class="identifier">pos</span> <span class="operator">=</span> <span class="identifier">an_env</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data3</span>, <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{outdir}/{chunk_id}"</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">447</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">82</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data3</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">448</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">449</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">450</td>
-                    <td class="coverage">526<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">85</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.data</span> <span class="operator">&lt;-</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">func</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">.data</span><span class="paren">)</span>,<span class="identifier">cmd</span><span class="operator">$</span><span class="identifier">dotdotdot</span><span class="paren">)</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">an_env</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">451</td>
+                    <td class="num">86</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">452</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">87</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"foverlaps.disk.frame: only merge_by_chunk_id = TRUE is implemented"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">453</td>
-                    <td class="coverage">425<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">88</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">.data</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">454</td>
+                    <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -20730,3071 +24421,2969 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/anti_join.r" class="hidden">
+            <div id="R/add_chunk.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param by join by</span></pre>
+                      <pre class="language-r"><span class="comment">#' Add a chunk to the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param copy same as dplyr::anti_join</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id the merge is performed by chunk id</span></pre>
+                      <pre class="language-r"><span class="comment">#' If no chunk_id is specified, then the chunk is added at the end as the</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite output directory</span></pre>
+                      <pre class="language-r"><span class="comment">#' largest numbered file, "n.fst".</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... same as dplyr's joins</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
+                      <pre class="language-r"><span class="comment">#' @details The function is the preferred way to add a chunk to a disk.frame. It</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom rlang quo enquos</span></pre>
+                      <pre class="language-r"><span class="comment">#'   performs checks on the types to make sure that the new chunk doesn't have</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr anti_join left_join full_join semi_join inner_join</span></pre>
+                      <pre class="language-r"><span class="comment">#'   different types to the disk.frame.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return disk.frame or data.frame/data.table</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df the disk.frame to add a chunk to</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk a data.frame to be added as a chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df.df = as.disk.frame(data.frame(x = 1:3, y = 4:6), overwrite = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk_id a numeric number indicating the id of the chunk. If NULL it</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df2.df = as.disk.frame(data.frame(x = 1:2, z = 10:11), overwrite = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#'   will be set to the largest chunk_id + 1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param full.names whether the chunk_id name match should be to the full file</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' anti_joined.df = anti_join(df.df, df2.df) </span></pre>
+                      <pre class="language-r"><span class="comment">#'   path not just the file name</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' anti_joined.df %&gt;% collect</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom utils capture.output</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' anti_joined.data.frame = anti_join(df.df, data.frame(x = 1:2, z = 10:11))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' # create a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(df.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' df_path = file.path(tempdir(), "tmp_add_chunk")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(df2.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' diskf = disk.frame(df_path)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(anti_joined.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">anti_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_anti_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' # add a chunk to diskf</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' add_chunk(diskf, cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">27</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' add_chunk(diskf, cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">29</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(diskf) # 2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">31</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' df2 = disk.frame(file.path(tempdir(), "tmp_add_chunk2"))</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">32</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">33</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' # add chunks by specifying the chunk_id number; this is especially useful if</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">34</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">anti_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # you wish to add multiple chunk in parralel</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">35</td>
-                    <td class="coverage">16<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' add_chunk(df2, data.frame(chunk=1), 1)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">37</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' add_chunk(df2, data.frame(chunk=2), 3)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">38</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">39</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(df2) # 2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">41</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' dir(attr(df2, "path", exact=TRUE))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">42</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # [1] "1.fst" "3.fst"</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">45</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(diskf)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">46</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(df2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">47</td>
-                    <td class="coverage">8<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">add_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk</span>, <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">48</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># sometimes chunk_id is defined in terms of itself</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">49</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">50</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">51</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">52</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">anti_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"can not add_chunk as this is not a disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">53</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="paren">(</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">shardkey</span>, <span class="string">""</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">identical</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#res = map2.disk.frame(x, y, ~{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">55</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">map2</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="comment"># get the metadata for all chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">56</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">57</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span>, <span class="identifier">glob</span> <span class="operator">=</span> <span class="string">"*.fst"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">58</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">59</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="comment"># if a chunk_id is not specified</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">61</td>
-                    <td class="coverage">21<em>x</em></td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">anti_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="keyword">...</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">62</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">22<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="number">1</span> <span class="operator">+</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_int</span><span class="paren">(</span><span class="identifier">files</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">63</td>
-                    <td class="coverage">4<em>x</em></td>
+                    <td class="coverage">58<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">s</span> <span class="operator">=</span> <span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">str_extract</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"[:digit:]+\\.fst"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">64</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">65</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">66</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">67</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">68</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">69</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/overwrite_check.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Check if the outdir exists or not</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">58<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description </span></pre>
+                      <pre class="language-r">      <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">substr</span><span class="paren">(</span><span class="identifier">s</span>, <span class="number">1</span>, <span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">s</span><span class="paren">)</span> <span class="operator">-</span> <span class="number">4</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">22<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' If the overwrite is TRUE then the folder will be deleted, otherwise the folder will be created.</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span>, <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite TRUE or FALSE if `outdir`` exists and overwrite = FALSE then throw an error</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">68</td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">71</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">72</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{as.integer(chunk_id)}.fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' tf = tempfile()</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># if the chunk_id is not numeric</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">74</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' overwrite_check(tf, overwrite = FALSE)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">75</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' overwrite_check(tf, overwrite = TRUE)</span></pre>
+                      <pre class="language-r">        <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">77</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">        <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">chunk_id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' fs::dir_delete(tf)</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">overwrite_check</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">##browser</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">19</td>
-                    <td class="coverage">861<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">20</td>
-                    <td class="coverage">!</td>
+                    <td class="num">81</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"outdir is NULL; no overwrite check is performed"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">21</td>
+                    <td class="num">82</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">NULL</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"failed to add_chunk as chunk_id = {chunk_id} already exist"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">24</td>
-                    <td class="coverage">861<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">439<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">85</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The directory is {outdir} is not a disk.frame folder. Execution has stopped to prevent accidental deletion of potentially important files"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">metas</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">files</span>, <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">metadata_fst</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">86</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">438<em>x</em></td>
+                    <td class="num">87</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">!=</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">types</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"unknown"</span>, <span class="string">"character"</span>, <span class="string">"factor"</span>, <span class="string">"ordered factor"</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="num">88</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">tryCatch</span><span class="paren">(</span><span class="paren">{</span></pre>
+                      <pre class="language-r">               <span class="string">"integer"</span>, <span class="string">"POSIXct"</span>, <span class="string">"difftime"</span>, <span class="string">"IDate"</span>, <span class="string">"ITime"</span>, <span class="string">"double"</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="num">89</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">               <span class="string">"Date"</span>, <span class="string">"POSIXct"</span>, <span class="string">"difftime"</span>, <span class="string">"ITime"</span>, <span class="string">"logical"</span>, <span class="string">"integer64"</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">6<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">32</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">33</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"Failed to delete the directory {outdir} in preparation for overwrite, this could be due to many reason and may be a genuine bug. Firstly, though, please ensure you do not have the folder open by Explorer (Windows) or other file management systems"</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">34</td>
-                    <td class="coverage"></td>
+                    <td class="num">90</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">               <span class="string">"nanotime"</span>, <span class="string">"raw"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">92</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="comment"># need to ensure that all column names and types match</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">438<em>x</em></td>
+                    <td class="num">93</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">metas_df</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap_dfr</span><span class="paren">(</span><span class="identifier">metas</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">422<em>x</em></td>
+                    <td class="num">94</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">overwrite</span> <span class="operator">==</span> <span class="literal">FALSE</span> <span class="operator">&amp;</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                              <span class="operator">~</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">2<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"overwrite  = FALSE and outdir '{outdir}' already exists"</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">40</td>
-                    <td class="coverage"></td>
+                    <td class="num">95</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">                                <span class="identifier">colnames</span> <span class="operator">=</span> <span class="identifier">.x</span><span class="operator">$</span><span class="identifier">columnNames</span>, </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">420<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">42</td>
-                    <td class="coverage"></td>
+                    <td class="num">96</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">                                <span class="identifier">coltypes</span> <span class="operator">=</span> <span class="identifier">types</span><span class="paren">[</span><span class="identifier">.x</span><span class="operator">$</span><span class="identifier">columnTypes</span><span class="paren">]</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">43</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">97</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">                                <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/move_to.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Move or copy a disk.frame to another location</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">99</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                      <pre class="language-r">    <span class="identifier">metas_df_summ</span> <span class="operator">=</span> <span class="identifier">metas_df</span><span class="paren">[</span>,<span class="identifier">.N</span>,.<span class="paren">(</span><span class="identifier">colnames</span>, <span class="identifier">coltypes</span><span class="paren">)</span><span class="paren">]</span><span class="paren">[</span><span class="identifier">order</span><span class="paren">(</span><span class="identifier">N</span><span class="paren">)</span><span class="paren">]</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">100</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df The disk.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">metas_df_summ</span><span class="paren">[</span>,<span class="identifier">existing_df</span> <span class="operator">:</span><span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir The new location</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">102</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param copy Merely copy and not move</span></pre>
+                      <pre class="language-r">    <span class="identifier">new_chunk_meta</span> <span class="operator">=</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">103</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... NOT USED</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">104</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="identifier">colnames</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">105</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return a disk.frame</span></pre>
+                      <pre class="language-r">        <span class="identifier">coltypes</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">typeof</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">unlist</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">106</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">107</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">108</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="identifier">merged_meta</span> <span class="operator">=</span> <span class="identifier">full_join</span><span class="paren">(</span><span class="identifier">new_chunk_meta</span>, <span class="identifier">metas_df_summ</span>, <span class="identifier">by</span><span class="operator">=</span><span class="identifier">c</span><span class="paren">(</span><span class="string">"colnames"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">109</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">merged_meta</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">110</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars_copy.df = copy_df_to(cars.df, outdir = tempfile(fileext=".df"))</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">111</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="comment"># find out which vars are matched</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">112</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2.df = move_to(cars.df, outdir = tempfile(fileext=".df"))</span></pre>
+                      <pre class="language-r">    <span class="identifier">check_vars</span> <span class="operator">=</span> <span class="identifier">full_join</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">113</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="identifier">new_chunk_meta</span><span class="paren">[</span>,.<span class="paren">(</span><span class="identifier">colnames</span>, <span class="identifier">new_chunk</span><span class="paren">)</span><span class="paren">]</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">114</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">      <span class="identifier">metas_df</span><span class="paren">[</span>,.<span class="paren">(</span><span class="identifier">colnames</span><span class="operator">=</span><span class="identifier">unique</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">)</span>, <span class="identifier">existing_df</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"colnames"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">115</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars_copy.df)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">19</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">116</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
+                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">117</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">move_to</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">[</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">21</td>
+                    <td class="num">118</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_exists</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">22</td>
+                    <td class="num">119</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">120</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">          <span class="string">"these variables are in the disk.frame but not in the new chunk:  \n {paste0(check_vars[is.na(new_chunk), colnames], collapse=',\n  ')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">121</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">25</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">122</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">copy</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="literal">TRUE</span>, <span class="literal">FALSE</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">[</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">existing_df</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">26</td>
+                    <td class="num">123</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"disk.frame::move_to ERROR: copy argument must be TRUE or FALSE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"these variables are in the new chunk but not in the existing disk.frame: {paste0(check_vars[is.na(existing_df), colnames], collapse=', ')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">124</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">125</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">126</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">## copy all files over</span></pre>
+                      <pre class="language-r">    <span class="comment"># find out which vars are matched but the types don't match</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">30</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">127</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">listfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">metas_df_summ1</span> <span class="operator">=</span> <span class="identifier">merged_meta</span><span class="paren">[</span><span class="identifier">existing_df</span> <span class="operator">==</span> <span class="literal">TRUE</span> <span class="operator">&amp;</span> <span class="identifier">new_chunk</span> <span class="operator">==</span> <span class="literal">TRUE</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.x</span> <span class="operator">!=</span> <span class="identifier">coltypes.y</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">31</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">128</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">shortlistfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># find incompatible types</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">32</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">129</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk2</span><span class="paren">(</span><span class="identifier">listfiles</span>, <span class="identifier">shortlistfiles</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">metas_df_summ1</span><span class="paren">[</span>, <span class="identifier">incompatible_types</span> <span class="operator">:</span><span class="operator">=</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">33</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">130</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span>, <span class="string">"Date"</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">==</span> <span class="string">"character"</span> <span class="operator">|</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">34</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">131</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_copy</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">==</span> <span class="string">"character"</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span>, <span class="string">"Date"</span><span class="paren">)</span> <span class="operator">|</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">35</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">132</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">==</span> <span class="string">"Date"</span> <span class="operator">|</span> </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">36</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">133</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">==</span> <span class="string">"Date"</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">134</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">135</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">39</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">136</td>
+                    <td class="coverage">20<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">metas_df_summ2</span> <span class="operator">=</span> <span class="identifier">metas_df_summ1</span><span class="paren">[</span><span class="identifier">incompatible_types</span> <span class="operator">==</span> <span class="literal">TRUE</span>,<span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">137</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">## copy .metadata over</span></pre>
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">138</td>
+                    <td class="coverage">20<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">metas_df_summ2</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">41</td>
+                    <td class="num">139</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"the belows types are incompatible between the new chunk and the disk.frame; this chunk can not be added\n"</span><span class="paren">)</span></pre>
                     </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">42</td>
-                    <td class="coverage"></td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">140</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">utils</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">capture.output</span><span class="paren">(</span><span class="identifier">metas_df_summ2</span><span class="paren">)</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">"\n"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">43</td>
+                    <td class="num">141</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">metadata_path</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="string">".metadata"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">142</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">45</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">143</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">listfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">metadata_path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">144</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">shortlistfiles</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">metadata_path</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">145</td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">walk2</span><span class="paren">(</span><span class="identifier">listfiles</span>, <span class="identifier">shortlistfiles</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">chunk_id</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">48</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">146</td>
+                    <td class="coverage">24<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">49</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">147</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_copy</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/map2.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' `cmap2` a function to two disk.frames</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">51</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_move</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="string">".metadata"</span>, <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' Perform a function on both disk.frames .x and .y, each chunk of .x and .y</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' gets run by .f(x.chunk, y.chunk)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @param .x a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .y a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">56</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">delete</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .f a function to be called on each chunk of x and y matched by</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#'   chunk_id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">59</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import stringr fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr as_mapper map2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname move_to</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">copy_df_to</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap2</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">65</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">move_to</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="keyword">...</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/remove_chunk.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Removes a chunk from the disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2.df = cmap2(cars.df, cars.df, ~data.table::rbindlist(list(.x, .y)))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunk_id the chunk ID of the chunk to remove. If it's a number then return number.fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param full.names TRUE or FALSE. Defaults to FALSE. If true then chunk_id is the full path to the chunk otherwise it's the relative path</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # TODO add these to tests</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 4)</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap2</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">26</td>
+                    <td class="coverage">10<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"cmap2"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # removes 3rd chunk</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, 3)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 3</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # removes 4th chunk</span></pre>
+                      <pre class="language-r"><span class="identifier">map2</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">32</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map2"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, "4.fst")</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 3</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # removes 2nd chunk</span></pre>
+                      <pre class="language-r"><span class="identifier">map2.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">37</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map2</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">.y</span>,<span class="identifier">.f</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, file.path(attr(cars.df, "path"), "2.fst"), full.names = TRUE)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 1</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="identifier">map2.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">42</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"map2.disk.frame(df, df1, ..) where df is disk.frame is deprecated. Use cmap(df, df1, ...) instead"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">remove_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">46</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">27</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">48</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">cmap2.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{as.integer(chunk_id)}.fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">29</td>
-                    <td class="coverage"></td>
+                    <td class="num">49</td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">30</td>
+                    <td class="num">50</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">deparse</span><span class="paren">(</span><span class="identifier">substitute</span><span class="paren">(</span><span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">.y</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">paste</span><span class="paren">(</span><span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">"\n"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">31</td>
+                    <td class="num">51</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">chunk_id</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"running %s : the .x argument must be a disk.frame"</span>, <span class="identifier">code</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">33</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">53</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">35</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#if(filename %in% fs::dir_ls(path, glob="*.fst")) {</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">58</td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">59</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_delete</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">61</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"the chunk {filename} does not exist and hence can't be removed; make sure you suffix the file with the .fst extension"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># get all the chunk ids</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">42</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">62</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">xc</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">63</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">df</span></pre>
+                      <pre class="language-r">    <span class="identifier">xc</span><span class="paren">[</span>,<span class="identifier">xid</span><span class="operator">:</span><span class="operator">=</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">44</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">yc</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/write_disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Write disk.frame to disk</span></pre>
+                      <pre class="language-r">    <span class="identifier">yc</span><span class="paren">[</span>,<span class="identifier">yid</span><span class="operator">:</span><span class="operator">=</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.y</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">67</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Write a data.frame/disk.frame to a disk.frame location. If df is a data.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">xyc</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span><span class="identifier">xc</span>, <span class="identifier">yc</span>, <span class="identifier">by</span><span class="operator">=</span><span class="string">"cid"</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">allow.cartesian</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' then using the as.disk.frame function is recommended for most cases</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir output directory for the disk.frame</span></pre>
+                      <pre class="language-r">    <span class="comment"># apply the functions</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite output directory</span></pre>
+                      <pre class="language-r">    <span class="comment">#future.apply::future_mapply(function(xid, yid, outid) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby the columns to shard by</span></pre>
+                      <pre class="language-r">    <span class="comment">#mapply(function(xid, yid, outid) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">74</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress compression ratio for fst files</span></pre>
+                      <pre class="language-r">    <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_pmap</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">xid</span>, <span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">yid</span>, <span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">cid</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">xid</span>, <span class="identifier">yid</span>, <span class="identifier">outid</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">75</td>
+                    <td class="coverage">126<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
+                      <pre class="language-r">      <span class="identifier">xch</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">xid</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">76</td>
+                    <td class="coverage">126<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
+                      <pre class="language-r">      <span class="identifier">ych</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.y</span>, <span class="identifier">yid</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">77</td>
+                    <td class="coverage">126<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending. </span></pre>
+                      <pre class="language-r">      <span class="identifier">xych</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">xch</span>, <span class="identifier">ych</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">78</td>
+                    <td class="coverage">126<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to map.disk.frame</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">xych</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">79</td>
+                    <td class="coverage">111<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">xych</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">outid</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst fs</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">81</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"one of the chunks, {xid}, is empty"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">83</td>
+                    <td class="coverage">126<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">85</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="comment">#,xyc$xid, xyc$yid, xyc$cid # together with mapply</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">21</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">86</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # write out a lazy disk.frame to disk</span></pre>
+                      <pre class="language-r">    , <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2.df = write_disk.frame(map(cars.df, ~.x[1,]), overwrite = TRUE)</span></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(cars2.df)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">89</td>
+                    <td class="coverage">25<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">90</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">    <span class="comment"># if .y is not a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">27</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">92</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"in cmap2(.x,.y,...) the .y is not a disk.frame, so returning a list instead of a disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">93</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">write_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">29</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">94</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">df</span>,</pre>
+                      <pre class="language-r">    <span class="identifier">f_for_passing</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">30</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">95</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r">    <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">31</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">96</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">ifelse</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp_disk.frame</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">32</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">97</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="string">"disk.frame"</span><span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map2</span><span class="paren">(</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">tmp_disk.frame</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">.y</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">xs</span>, <span class="identifier">ys</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">33</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">98</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nchunks.disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r">      <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">tmp_disk.frame</span>, <span class="identifier">xs</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">ys</span><span class="paren">)</span>, <span class="identifier">ddd</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">99</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">35</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">100</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>,</pre>
+                      <pre class="language-r">      <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">f_for_passing</span>, <span class="identifier">ddd</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">shardby</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">102</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">328<em>x</em></td>
+                    <td class="num">103</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">328<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">104</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">105</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">106</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">328<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/sas2disk_frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"outdir must not be NULL"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Convert a SAS file (.sas7bdat) format to CSV or disk.frame by chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param infile the SAS7BDAT file</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk which convert of nchunks to convert</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">328<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sas2csvpath path to sas2csv.exe</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">4<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">map.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="operator">~</span><span class="identifier">.x</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sep separater of the CSV file, defaults to |</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># TODO really inefficient</span></pre>
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#df2 = map.disk.frame(df, ~.x, outdir = outdir, lazy = FALSE, ..., compress = compress, overwrite = TRUE)</span></pre>
+                      <pre class="language-r"><span class="identifier">sas_to_csv</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">infile</span>, <span class="identifier">chunk</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_size</span><span class="paren">(</span><span class="identifier">infile</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">sas2csvpath</span> <span class="operator">=</span> <span class="string">"sas2csv/sas2csv.exe"</span>, <span class="identifier">sep</span><span class="operator">=</span><span class="string">"|"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">52</td>
+                    <td class="num">10</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df</span>,</pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">sas2csvpath</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">53</td>
+                    <td class="num">11</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>,</pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"You must have the sas2csv.exe installed. Only Windows is supported at the moment. Please contact the author"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">54</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">55</td>
+                    <td class="num">13</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">sasfile</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">'"{infile}"'</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">56</td>
+                    <td class="num">14</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">57</td>
+                    <td class="num">15</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span>, <span class="identifier">chunk</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">58</td>
+                    <td class="num">16</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">options</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"-o outcsv/{chunk}/ -d {sep} -c -n {nchunks} -k {paste(chunk-1,collapse = ' ')} -m"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">59</td>
+                    <td class="num">18</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">cmd</span> <span class="operator">=</span> <span class="identifier">paste</span><span class="paren">(</span><span class="identifier">sas2csvpath</span>, <span class="identifier">sasfile</span>, <span class="identifier">options</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">60</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">19</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="keyword">...</span></pre>
+                      <pre class="language-r">  <span class="identifier">system</span><span class="paren">(</span><span class="identifier">cmd</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">63</td>
-                    <td class="coverage">324<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">324<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="string">".out.disk.frame.id"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">324<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">df</span><span class="paren">[</span>,<span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Convert a SAS file (.sas7bdat format) to disk.frame via CSVs</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">66</td>
-                    <td class="coverage">1586<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">.SD</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param inpath input SAS7BDAT file</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">67</td>
-                    <td class="coverage">1586<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">24</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="identifier">list_columns</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">.SD</span>, <span class="identifier">is.list</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outpath output disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">68</td>
-                    <td class="coverage">1586<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="identifier">list_columns</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">26</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The data frame contains these list-columns: '{paste0(names(.SD)[list_columns], collapse='\', \'')}'. List-columns are not yet supported by disk.frame. Remove these columns to create a disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sep separater of the intermediate CSV file, defaults to |</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param remove_csv TRUE/FALSE. Remove the intermediate CSV after usage?</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">71</td>
-                    <td class="coverage">1585<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">28</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">.SD</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">.BY</span>, <span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future %&lt;-%</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">72</td>
-                    <td class="coverage">1585<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">29</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#' @family ingesting data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">            <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">sas_to_disk.frame</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">inpath</span>, <span class="identifier">outpath</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">inpath</span><span class="paren">)</span>, <span class="identifier">sas2csvpath</span> <span class="operator">=</span> <span class="string">"sas2csv/sas2csv.exe"</span>, <span class="identifier">sep</span> <span class="operator">=</span> <span class="string">"|"</span>, <span class="identifier">remove_csv</span> <span class="operator">=</span> <span class="literal">T</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">75</td>
-                    <td class="coverage">1585<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">32</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="literal">NULL</span></pre>
+                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nchunks</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">76</td>
-                    <td class="coverage">324<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">33</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">.out.disk.frame.id</span><span class="paren">]</span></pre>
+                      <pre class="language-r">  <span class="identifier">ready</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="literal">F</span>, <span class="identifier">nchunks</span><span class="paren">)</span> <span class="operator">|</span> <span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">77</td>
-                    <td class="coverage">323<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">34</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># ready = c(rep(T, 96), rep(F, 4))</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">78</td>
-                    <td class="coverage">323<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">35</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">extracting</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="literal">F</span>, <span class="identifier">nchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">80</td>
+                    <td class="num">37</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">as.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outpath</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">81</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">38</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">83</td>
+                    <td class="num">40</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"write_disk.frame error: df must be a disk.frame or data.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">print</span><span class="paren">(</span><span class="string">"this program converts SAS datasets to CSV first before conversion to disk.frame."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">84</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"the intermediate CSVs are here: {file.path(getwd(), 'outcsv')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">85</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">86</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="keyword">while</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">ready</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">87</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">44</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname write_disk.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">F</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">88</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">45</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">output_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">extracting_jobs</span> <span class="operator">=</span> <span class="literal">F</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">89</td>
+                    <td class="num">46</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"output_disk.frame is DEPRECATED. Use write_disk.frame istead"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">for</span><span class="paren">(</span><span class="identifier">w</span> <span class="keyword">in</span> <span class="identifier">which</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">ready</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">90</td>
+                    <td class="num">47</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">incsv</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="string">"outcsv"</span>, <span class="identifier">w</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="string">"_"</span>, <span class="identifier">w</span><span class="operator">-</span><span class="number">1</span>,<span class="string">".csv"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">91</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">48</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/glm.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">49</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Fit generalized linear models (glm) with disk.frame</span></pre>
+                      <pre class="language-r">        <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">T</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">50</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="identifier">ready</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span> <span class="operator">=</span> <span class="literal">T</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">51</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @inherit biglm::bigglm</span></pre>
+                      <pre class="language-r">        <span class="identifier">ok</span> <span class="operator">%&lt;-%</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">52</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">          <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fread</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst.tmp"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">53</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description  </span></pre>
+                      <pre class="language-r">          <span class="identifier">file.rename</span><span class="paren">(</span><span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst.tmp"</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outpath</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">w</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">54</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Fits GLMs using `{speedglm}` or `{biglm}`. The return object will be exactly as</span></pre>
+                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">remove_csv</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' those return by those functions. This is a convenience wrapper</span></pre>
+                      <pre class="language-r">            <span class="identifier">file.remove</span><span class="paren">(</span><span class="identifier">incsv</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">          <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">57</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param glm_backend Which package to use for fitting GLMs. The default is</span></pre>
+                      <pre class="language-r">          <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   "biglm", which has known issues with factor level if different levels are</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">59</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   present in different chunks. The "speedglm" option is more robust, but does not</span></pre>
+                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"converting: {w} of {nchunks}; time: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">60</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">extracting_jobs</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">extracting</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   implement `predict` which makes prediction and implementation impossible.</span></pre>
+                      <pre class="language-r">      </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">62</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="identifier">done1</span> <span class="operator">=</span> <span class="literal">T</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">63</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family Machine Learning (ML)</span></pre>
+                      <pre class="language-r">        <span class="identifier">extracting_jobs</span> <span class="operator">=</span> <span class="literal">T</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">64</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">extracting</span><span class="paren">[</span><span class="identifier">w</span><span class="paren">]</span> <span class="operator">&lt;-</span> <span class="literal">T</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">65</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="identifier">ok</span> <span class="operator">%&lt;-%</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">66</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">          <span class="identifier">sas_to_csv</span><span class="paren">(</span><span class="identifier">inpath</span>, <span class="identifier">w</span>, <span class="identifier">nchunks</span>, <span class="identifier">sas2csvpath</span>, <span class="identifier">sep</span> <span class="operator">=</span> <span class="identifier">sep</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">19</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">68</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' m = dfglm(dist ~ speed, data = cars.df)</span></pre>
+                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"extracting: {w} of {nchunks}; time: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # can use normal R functions</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' summary(m)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">72</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' predict(m, get_chunk(cars.df, 1))</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">done1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">73</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' predict(m, collect(cars.df))</span></pre>
+                      <pre class="language-r">      <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"didn't get any work: {Sys.time()}"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">74</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">      <span class="identifier">Sys.sleep</span><span class="paren">(</span><span class="number">18</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # can use broom to tidy up the returned info</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' broom::tidy(m)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/write_disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' Write disk.frame to disk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">dfglm</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">data</span>, <span class="keyword">...</span>, <span class="identifier">glm_backend</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"biglm"</span>, <span class="string">"speedglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Write a data.frame/disk.frame to a disk.frame location. If df is a data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">33</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">glm_backend</span> <span class="operator">=</span> <span class="identifier">match.arg</span><span class="paren">(</span><span class="identifier">glm_backend</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' then using the as.disk.frame function is recommended for most cases</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">35</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">data</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">36</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">streaming_fn</span> <span class="operator">&lt;-</span> <span class="identifier">make_glm_streaming_fn</span><span class="paren">(</span><span class="identifier">data</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">38</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"speedglm"</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">39</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"speedglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">40</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"speedglm package not installed. To install run `install.packages('speedglm')`"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir output directory for the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">42</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">speedglm</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shglm</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">streaming_fn</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">glm_backend</span> <span class="operator">==</span> <span class="string">"biglm"</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite output directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"biglm"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby the columns to shard by</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">45</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"biglm package not installed. To install run `install.packages('biglm')`"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress compression ratio for fst files</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">biglm</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">bigglm</span><span class="paren">(</span><span class="identifier">formula</span>, <span class="identifier">data</span> <span class="operator">=</span> <span class="identifier">streaming_fn</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending. </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">49</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"glm_backend must be one of 'speedglm' or 'biglm'"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to cmap.disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst fs</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/shard.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Shard a data.frame/data.table or disk.frame into chunk and saves it into a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df A data.frame/data.table or disk.frame. If disk.frame, then rechunk(df, ...) is run</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby The column(s) to shard the data by.</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir The output directory of the disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' # write out a lazy disk.frame to disk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite If TRUE then the chunks are overwritten</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars2.df = write_disk.frame(cmap(cars.df, ~.x[1,]), overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param sort_splits If shardby_function is "sort", the split values for sharding</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table setDT</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r"><span class="identifier">write_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="identifier">df</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">  <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">ifelse</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # shard the cars data.frame by speed so that rows with the same speed are in the same chunk</span></pre>
+                      <pre class="language-r">    <span class="string">"disk.frame"</span><span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' iris.df = shard(iris, "Species")</span></pre>
+                      <pre class="language-r">    <span class="identifier">nchunks.disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
+                      <pre class="language-r">  <span class="identifier">shardby</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">shard</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">253<em>x</em></td>
+                    <td class="num">38</td>
+                    <td class="coverage">314<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">23</td>
-                    <td class="coverage">253<em>x</em></td>
+                    <td class="num">39</td>
+                    <td class="coverage">314<em>x</em></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">24</td>
-                    <td class="coverage">253<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"hash"</span>, <span class="string">"sort"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">253<em>x</em></td>
+                    <td class="num">42</td>
+                    <td class="coverage">314<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">27</td>
-                    <td class="coverage">252<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"outdir must not be NULL"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">252<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">44</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"hash"</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">219<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">45</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Hashing..."</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">219<em>x</em></td>
+                    <td class="num">46</td>
+                    <td class="coverage">314<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">161<em>x</em></td>
+                    <td class="num">47</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := hashstr2i(as.character({shardby}), nchunks)]"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">32</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="operator">~</span><span class="identifier">.x</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">lazy</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">58<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">49</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">shardby_list</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"paste0({paste0(sort(shardby),collapse=',')})"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">58<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := hashstr2i({shardby_list}, nchunks)]"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="comment"># TODO really inefficient</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="comment">#df2 = cmap.disk.frame(df, ~.x, outdir = outdir, lazy = FALSE, ..., compress = compress, overwrite = TRUE)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">36</td>
-                    <td class="coverage">33<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">52</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"sort"</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">33<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">53</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">            <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">54</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"Only one chunk: set .out.disk.frame.id = 0"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">39</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := 0]"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">40</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">56</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">            <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">57</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">shard_by_rule</span> <span class="operator">&lt;-</span> <span class="identifier">sortablestr2i</span><span class="paren">(</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">58</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">shard_by_rule</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">32<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">59</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := {shard_by_rule}]"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span>,</pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">            <span class="keyword">...</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">            <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">252<em>x</em></td>
+                    <td class="num">63</td>
+                    <td class="coverage">310<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">tryCatch</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">252<em>x</em></td>
+                    <td class="num">64</td>
+                    <td class="coverage">310<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="string">".out.disk.frame.id"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">310<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">df</span><span class="paren">[</span>,<span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">66</td>
+                    <td class="coverage">1496<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">.SD</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">67</td>
+                    <td class="coverage">1496<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="identifier">list_columns</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">.SD</span>, <span class="identifier">is.list</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">68</td>
+                    <td class="coverage">1496<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">if</span><span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="identifier">list_columns</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span><span class="operator">=</span><span class="identifier">code</span><span class="paren">)</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r">            <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The data frame contains these list-columns: '{paste0(names(.SD)[list_columns], collapse='\', \'')}'. List-columns are not yet supported by disk.frame. Remove these columns to create a disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">252<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">70</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">          <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">50</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">71</td>
+                    <td class="coverage">1495<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"error occurred in shard"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">.SD</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">.BY</span>, <span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">51</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">72</td>
+                    <td class="coverage">1495<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">            <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r">            <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">          <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">54</td>
-                    <td class="coverage">252<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">".out.disk.frame.id"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">55</td>
-                    <td class="coverage"></td>
+                    <td class="num">75</td>
+                    <td class="coverage">1495<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">        <span class="literal">NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">56</td>
-                    <td class="coverage">252<em>x</em></td>
+                    <td class="num">76</td>
+                    <td class="coverage">310<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span>  </pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">.out.disk.frame.id</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">252<em>x</em></td>
+                    <td class="num">77</td>
+                    <td class="coverage">309<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">58</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">78</td>
+                    <td class="coverage">309<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">59</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">79</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">nchunks_rechunk</span> <span class="operator">=</span> <span class="identifier">nchunks</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">80</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">rechunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks_rechunk</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">as.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"write_disk.frame error: df must be a disk.frame or data.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">85</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' `distribute` is an alias for `shard`</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">86</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname shard</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname write_disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">distribute</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">output_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">68</td>
+                    <td class="num">89</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"shard"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"output_disk.frame is DEPRECATED. Use write_disk.frame istead"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">90</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -23803,2115 +27392,2142 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/hard_arrange.r" class="hidden">
+            <div id="R/show_ceremony.R" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Perform a hard arrange</span></pre>
+                      <pre class="language-r"><span class="comment">#' Show the code to setup disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' A hard_arrange is a sort by that also reorganizes the chunks to ensure that</span></pre>
+                      <pre class="language-r"><span class="identifier">show_ceremony</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">4</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' every unique grouping of `by`` is in the same chunk. Or in other words, every</span></pre>
+                      <pre class="language-r">  <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="identifier">crayon</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">green</span><span class="paren">(</span><span class="identifier">ceremony_text</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' row that share the same `by` value will end up in the same chunk.</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... grouping variables</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the out put directory</span></pre>
+                      <pre class="language-r"><span class="identifier">ceremony_text</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param add same as dplyr::arrange</span></pre>
+                      <pre class="language-r">"</pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .drop same as dplyr::arrange</span></pre>
+                      <pre class="language-r"><span class="comment"># this willl set disk.frame with multiple workers</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">13</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="identifier">setup_disk.frame</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment"># this will allow unlimited amount of data to be passed from worker to worker</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">15</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' iris.df = as.disk.frame(iris, nchunks = 2)</span></pre>
+                      <pre class="language-r"><span class="identifier">options</span><span class="paren">(</span><span class="identifier">future.globals.maxSize</span> <span class="operator">=</span> <span class="literal">Inf</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">"</pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # arrange iris.df by specifies and ensure rows with the same specifies are in the same chunk</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' iris_hard.df = hard_arrange(iris.df, Species)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 1)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">21</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 2)</span></pre>
+                      <pre class="language-r"><span class="identifier">show_boilerplate</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="identifier">show_ceremony</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(iris_hard.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">insert_ceremony</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_arrange</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"rstudioapi"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">27</td>
-                    <td class="coverage">9<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"hard_arrange"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">rstudioapi</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">insertText</span><span class="paren">(</span><span class="identifier">ceremony_text</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">29</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"insert ceremony can only be used inside RStudio"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname hard_arrange</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/get_chunk.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
+                      <pre class="language-r"><span class="comment">#' Obtain one chunk by chunk id</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param n the chunk id. If numeric then matches by number, if character then returns the chunk with the same name as n</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param keep the columns to keep</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param full.names whether n is the full path to the chunks or just a relative path file name. Ignored if n is numeric</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param ... passed to fst::read_fst or whichever read function is used in the backend</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_arrange.data.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">3<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 2)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 1)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname hard_arrange</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 2)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, 1, keep = "speed")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">hard_arrange.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_hard_arrange"</span><span class="paren">)</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' # if full.names = TRUE then the full path to the chunk need to be provided</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">41</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(cars.df, file.path(attr(cars.df, "path"), "1.fst"), full.names = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># Refer also to Dplyr arrange: https://github.com/tidyverse/dplyr/blob/master/src/arrange.cpp</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">44</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">q</span> <span class="operator">&lt;-</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">is_sym</span> <span class="operator">&lt;-</span> <span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">q</span>, <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo_is_symbol</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">get_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="num">20</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">arrange_codes</span> <span class="operator">&lt;-</span> <span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">q</span>, <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_label</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"get_chunk"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># Check if desc...</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">6<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">is_desc</span> <span class="operator">&lt;-</span> <span class="identifier">substr</span><span class="paren">(</span><span class="identifier">arrange_codes</span>, <span class="number">1</span>, <span class="number">5</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"desc("</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># If expr is a symbol from the data, just use it.</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname get_chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># Otherwise need to evaluate ... </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fst read_fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># (TODO - currently only support variables and desc in the data)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># Peels off "desc" from the original</span></pre>
+                      <pre class="language-r"><span class="identifier">get_chunk.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">n</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">55</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="num">28</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">vars</span> <span class="operator">&lt;-</span> <span class="identifier">sub</span><span class="paren">(</span><span class="string">")"</span>, <span class="string">""</span>, <span class="identifier">sub</span><span class="paren">(</span><span class="string">"desc("</span>, <span class="string">""</span>, <span class="identifier">arrange_codes</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="num">30</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">desc_vars</span> <span class="operator">&lt;-</span> <span class="identifier">vars</span><span class="paren">[</span><span class="identifier">is_desc</span><span class="paren">]</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep_chunks</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"keep_chunks"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">59</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">32</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">vars</span> <span class="operator">%in%</span> <span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="comment"># TODO relax this</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">60</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="string">"Expressions currently not supported. Columns not found in colnames:"</span>, <span class="identifier">vars</span><span class="paren">[</span><span class="operator">!</span><span class="identifier">vars</span> <span class="operator">%in%</span> <span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># if(!is.null(keep_chunks)) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="comment">#   # browser()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="comment">#   # n_int = as.integer(n)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># Hard group by in a partially sorted way at the chunk level and then arrange within chunks</span></pre>
+                      <pre class="language-r">  <span class="comment">#   # </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">37</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">df</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">  <span class="comment">#   # if(is.na(n_int)) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">38</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">vars</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">nchunks</span>, <span class="identifier">overwrite</span><span class="operator">=</span><span class="identifier">overwrite</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"sort"</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #   if(as.character(n) %in% get_chunk_ids(df)[keep_chunks]) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">66</td>
-                    <td class="coverage">6<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">39</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">chunk_arrange</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #     return(NULL)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #   } else if(normalizePath(as.character(n)) %in% sapply(get_chunk_ids(df, full.names = TRUE)[keep_chunks],normalizePath)) {</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/print.disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Print disk.frame</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #     return(NULL)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #   }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' a new print method for disk.frame</span></pre>
+                      <pre class="language-r">  <span class="comment">#   # } else {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #   if(!n %in% keep_chunk) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x disk.frame</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #     return(NULL)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r">  <span class="comment">#   #   }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
+                      <pre class="language-r">  <span class="comment">#   # }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># TODO add chunk</span></pre>
+                      <pre class="language-r">  <span class="comment"># }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">print.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">10</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">paste</span><span class="paren">(</span><span class="identifier">sep</span> <span class="operator">=</span> <span class="string">"\n"</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">11</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"path: \"{attr(x,'path')}\""</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">12</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nchunks: {disk.frame::nchunks(x)}"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"keep"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">13</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">53</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow (at source): {disk.frame::nrow(x)}"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">14</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"ncol (at source): {disk.frame::ncol(x)}"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmds</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"lazyfn"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">15</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow (post operations): ???"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">1058<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">16</td>
+                    <td class="num">58</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"ncol (post operations): ???\n"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep1</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">18</td>
+                    <td class="num">60</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">message</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">19</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">keep1</span>, <span class="identifier">keep</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/ncol-nrow.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">61</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Number of rows or columns</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">keep</span> <span class="operator">%in%</span> <span class="identifier">keep1</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">62</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to base::nrow</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"some of the variables specified in keep = {keep} is not available"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">68</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return total number of column and rows</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">n</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">69</td>
+                    <td class="coverage">23<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' ncol(cars.df)</span></pre>
+                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">n</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">70</td>
+                    <td class="coverage">23<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nrow(cars.df)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">file.exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">71</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">[</span><span class="identifier">n</span><span class="paren">]</span>  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">74</td>
+                    <td class="coverage">1035<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nrow</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>,<span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">15</td>
-                    <td class="coverage">375<em>x</em></td>
+                    <td class="num">75</td>
+                    <td class="coverage">981<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nrow"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">n</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">77</td>
+                    <td class="coverage">54<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">n</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nrow.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="comment"># if the file you are looking for don't exist</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">22</td>
-                    <td class="coverage">348<em>x</em></td>
+                    <td class="num">82</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">23</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">83</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"The chunk {filename} does not exist; returning an empty data.table"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">84</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">notbl</span> <span class="operator">&lt;-</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">85</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">notbl</span>, <span class="string">"does not exist"</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="literal">TRUE</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">26</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">86</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">notbl</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nrow.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">29</td>
-                    <td class="coverage">27<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">27<em>x</em></td>
+                    <td class="num">89</td>
+                    <td class="coverage">1058<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path1</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">cmds</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">27<em>x</em></td>
+                    <td class="num">90</td>
+                    <td class="coverage">661<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">dir.exists</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="operator">!=</span><span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">27<em>x</em></td>
+                    <td class="num">91</td>
+                    <td class="coverage">661<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">columns</span> <span class="operator">=</span> <span class="identifier">keep</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">27<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">92</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">34</td>
+                    <td class="num">93</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="number">0</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">94</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">36</td>
-                    <td class="coverage">27<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">95</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmpfstmeta</span> <span class="operator">=</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">37</td>
-                    <td class="coverage">27<em>x</em></td>
+                    <td class="num">96</td>
+                    <td class="coverage">397<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="string">"nrOfRows"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpfstmeta</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">keep</span><span class="paren">)</span><span class="operator">!=</span><span class="string">"closure"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">27<em>x</em></td>
+                    <td class="num">97</td>
+                    <td class="coverage">397<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">path2</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">nrOfRows</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">play</span><span class="paren">(</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">columns</span> <span class="operator">=</span> <span class="identifier">keep</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">cmds</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">40</td>
+                    <td class="num">99</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">path2</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">NrOfRows</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">play</span><span class="paren">(</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">filename</span>, <span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span>,<span class="keyword">...</span><span class="paren">)</span>, <span class="identifier">cmds</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">100</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">101</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">102</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#return(fst::fst.metadata(path1)$NrOfRows)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/data.table.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow error: directory {} does not exist"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' [ interface for disk.frame using fst backend</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... same as data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param keep the columns to srckeep</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param rbind Whether to rbind the chunks. Defaults to TRUE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param use.names Same as in data.table::rbindlist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param fill Same as in data.table::rbindlist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">ncol</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param idcol Same as in data.table::rbindlist</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">52</td>
-                    <td class="coverage">171<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"ncol"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table rbindlist </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom globals findGlobals</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">ncol.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' speed_limit = 50</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">11<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">length</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df[speed &lt; speed_limit ,.N, cut(dist, pretty(dist))]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">ncol.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">`[.disk.frame`</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">rbind</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">160<em>x</em></td>
+                    <td class="num">22</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">ncol</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">keep_for_future</span> <span class="operator">=</span> <span class="identifier">keep</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/add_chunk.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">24</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Add a chunk to the disk.frame</span></pre>
+                      <pre class="language-r">  <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">substitute</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="comment">#this is an alist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">26</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' If no chunk_id is specified, then the chunk is added at the end as the</span></pre>
+                      <pre class="language-r">  <span class="identifier">ag</span> <span class="operator">=</span> <span class="identifier">globals</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">findGlobals</span><span class="paren">(</span><span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">27</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' largest numbered file, "n.fst".</span></pre>
+                      <pre class="language-r">  <span class="identifier">ag</span> <span class="operator">=</span> <span class="identifier">setdiff</span><span class="paren">(</span><span class="identifier">ag</span>, <span class="string">""</span><span class="paren">)</span> <span class="comment"># "" can cause issues with future</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">29</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @details The function is the preferred way to add a chunk to a disk.frame. It</span></pre>
+                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   performs checks on the types to make sure that the new chunk doesn't have</span></pre>
+                      <pre class="language-r">  <span class="comment">#lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   different types to the disk.frame.</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk</span> <span class="operator">=</span> <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span>, <span class="identifier">keep</span> <span class="operator">=</span> <span class="identifier">keep_for_future</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df the disk.frame to add a chunk to</span></pre>
+                      <pre class="language-r">    <span class="identifier">expr</span> <span class="operator">&lt;-</span> <span class="identifier">quote</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunk a data.frame to be added as a chunk</span></pre>
+                      <pre class="language-r">    <span class="identifier">expr</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">expr</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param chunk_id a numeric number indicating the id of the chunk. If NULL it</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">&lt;-</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">`[`</span>, <span class="identifier">expr</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">13</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">18<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   will be set to the largest chunk_id + 1</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param full.names whether the chunk_id name match should be to the full file</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span>, <span class="identifier">future.globals</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"df"</span>, <span class="string">"keep_for_future"</span>, <span class="string">"dotdotdot"</span>, <span class="identifier">ag</span><span class="paren">)</span>, <span class="identifier">future.packages</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"data.table"</span>,<span class="string">"disk.frame"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   path not just the file name</span></pre>
+                      <pre class="language-r">  <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">40</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom utils capture.output</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rbind</span> <span class="operator">&amp;</span> <span class="identifier">all</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">res</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">18</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">rbindlist</span><span class="paren">(</span><span class="identifier">res</span>, <span class="identifier">use.names</span> <span class="operator">=</span> <span class="identifier">use.names</span>, <span class="identifier">fill</span> <span class="operator">=</span> <span class="identifier">fill</span>, <span class="identifier">idcol</span> <span class="operator">=</span> <span class="identifier">idcol</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">42</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">rbind</span><span class="paren">)</span>  <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">43</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">unlist</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return disk.frame</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">20</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">45</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # create a disk.frame</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df_path = file.path(tempdir(), "tmp_add_chunk")</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' diskf = disk.frame(df_path)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment"># Solutions from https://stackoverflow.com/questions/57122960/how-to-use-non-standard-evaluation-nse-to-evaluate-arguments-on-data-table?answertab=active#tab-top</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # add a chunk to diskf</span></pre>
+                      <pre class="language-r"><span class="comment"># `[.dd` &lt;- function(x, ...) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' add_chunk(diskf, cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#   code &lt;- rlang::enexprs(...)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' add_chunk(diskf, cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#   lapply(x, function(dt) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#     ex &lt;- rlang::expr(dt[!!!code])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(diskf) # 2</span></pre>
+                      <pre class="language-r"><span class="comment">#     rlang::eval_tidy(ex)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">30</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#   })</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' df2 = disk.frame(file.path(tempdir(), "tmp_add_chunk2"))</span></pre>
+                      <pre class="language-r"><span class="comment"># }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment"># </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # add chunks by specifying the chunk_id number; this is especially useful if</span></pre>
+                      <pre class="language-r"><span class="comment"># </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">59</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # you wish to add multiple chunk in parralel</span></pre>
+                      <pre class="language-r"><span class="comment"># `[.dd` &lt;- function(x,...) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#   a &lt;- substitute(...()) #this is an alist</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' add_chunk(df2, data.frame(chunk=1), 1)</span></pre>
+                      <pre class="language-r"><span class="comment">#   expr &lt;- quote(x[[i]])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' add_chunk(df2, data.frame(chunk=2), 3)</span></pre>
+                      <pre class="language-r"><span class="comment">#   expr &lt;- c(expr, a)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#   res &lt;- list()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(df2) # 2</span></pre>
+                      <pre class="language-r"><span class="comment">#   for (i in seq_along(x)) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment">#     res[[i]] &lt;- do.call(`[`, expr)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' dir(attr(df2, "path"))</span></pre>
+                      <pre class="language-r"><span class="comment">#   }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # [1] "1.fst" "3.fst"</span></pre>
+                      <pre class="language-r"><span class="comment">#   res</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"><span class="comment"># }</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/nchunks.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' Returns the number of chunks in a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(diskf)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(df2)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param skip.ready.check NOT implemented</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">add_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk</span>, <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># sometimes chunk_id is defined in terms of itself</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">50</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">51</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is_disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"can not add_chunk as this is not a disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># get the metadata for all chunks</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">56</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">57</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span>, <span class="identifier">glob</span> <span class="operator">=</span> <span class="string">"*.fst"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' # return the number of chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">60</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment"># if a chunk_id is not specified</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">61</td>
-                    <td class="coverage">24<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">22<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="number">1</span> <span class="operator">+</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_int</span><span class="paren">(</span><span class="identifier">files</span>, <span class="operator">~</span><span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">63</td>
-                    <td class="coverage">58<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">s</span> <span class="operator">=</span> <span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">str_extract</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"[:digit:]+\\.fst"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunk(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">58<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">as.integer</span><span class="paren">(</span><span class="identifier">substr</span><span class="paren">(</span><span class="identifier">s</span>, <span class="number">1</span>, <span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">s</span><span class="paren">)</span> <span class="operator">-</span> <span class="number">4</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">22<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span>, <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">67</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="identifier">nchunks</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">68</td>
-                    <td class="coverage">24<em>x</em></td>
+                    <td class="num">16</td>
+                    <td class="coverage">257<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nchunks"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">71</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">72</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">20</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{as.integer(chunk_id)}.fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span> <span class="comment"># if the chunk_id is not numeric</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">74</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">nchunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">75</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">23</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nchunk"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">77</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">chunk_id</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">nchunk.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">81</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">29</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">nchunks.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">82</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">30</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"failed to add_chunk as chunk_id = {chunk_id} already exist"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">83</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_ls</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">85</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">33</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">files</span>, <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">metadata_fst</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">86</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">87</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">35</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">types</span> <span class="operator">&lt;-</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"unknown"</span>, <span class="string">"character"</span>, <span class="string">"factor"</span>, <span class="string">"ordered factor"</span>, </pre>
+                      <pre class="language-r"><span class="identifier">nchunks.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">skip.ready.check</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">88</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">36</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="string">"integer"</span>, <span class="string">"POSIXct"</span>, <span class="string">"difftime"</span>, <span class="string">"IDate"</span>, <span class="string">"ITime"</span>, <span class="string">"double"</span>, </pre>
+                      <pre class="language-r">  <span class="comment">#if(!skip.ready.check) stopifnot(is_ready(df))</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">89</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">37</td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="string">"Date"</span>, <span class="string">"POSIXct"</span>, <span class="string">"difftime"</span>, <span class="string">"ITime"</span>, <span class="string">"logical"</span>, <span class="string">"integer64"</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">fpath</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">90</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">38</td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="string">"nanotime"</span>, <span class="string">"raw"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.dir.disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">91</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">39</td>
+                    <td class="coverage">628<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">fpath</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">92</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># need to ensure that all column names and types match</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">93</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap_dfr</span><span class="paren">(</span><span class="identifier">metas</span>, </pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="number">1</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">94</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">42</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                              <span class="operator">~</span><span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">95</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                                <span class="identifier">colnames</span> <span class="operator">=</span> <span class="identifier">.x</span><span class="operator">$</span><span class="identifier">columnNames</span>, </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">96</td>
-                    <td class="coverage">20<em>x</em></td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/left_join.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                                <span class="identifier">coltypes</span> <span class="operator">=</span> <span class="identifier">types</span><span class="paren">[</span><span class="identifier">.x</span><span class="operator">$</span><span class="identifier">columnTypes</span><span class="paren">]</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' Performs join/merge for disk.frames</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">97</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                                <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname join</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">98</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">99</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df_summ</span> <span class="operator">=</span> <span class="identifier">metas_df</span><span class="paren">[</span>,<span class="identifier">.N</span>,.<span class="paren">(</span><span class="identifier">colnames</span>, <span class="identifier">coltypes</span><span class="paren">)</span><span class="paren">]</span><span class="paren">[</span><span class="identifier">order</span><span class="paren">(</span><span class="identifier">N</span><span class="paren">)</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">100</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df_summ</span><span class="paren">[</span>,<span class="identifier">existing_df</span> <span class="operator">:</span><span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">101</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">102</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">new_chunk_meta</span> <span class="operator">=</span> </pre>
+                      <pre class="language-r"><span class="comment">#' join.df = left_join(cars.df, cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">103</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">104</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">colnames</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">chunk</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">105</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">coltypes</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">typeof</span><span class="paren">)</span> <span class="operator">%&gt;%</span> <span class="identifier">unlist</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">106</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">new_chunk</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(join.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">107</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">left_join.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">copy</span><span class="operator">=</span><span class="literal">FALSE</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_left_join"</span><span class="paren">)</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">108</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">13</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">merged_meta</span> <span class="operator">=</span> <span class="identifier">full_join</span><span class="paren">(</span><span class="identifier">new_chunk_meta</span>, <span class="identifier">metas_df_summ</span>, <span class="identifier">by</span><span class="operator">=</span><span class="identifier">c</span><span class="paren">(</span><span class="string">"colnames"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">109</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">15</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">merged_meta</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">110</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">111</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">17</td>
+                    <td class="coverage">12<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># find out which vars are matched</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">112</td>
-                    <td class="coverage">20<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">check_vars</span> <span class="operator">=</span> <span class="identifier">full_join</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="comment"># note that x is named .data in the lazy evaluation</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">113</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">19</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">new_chunk_meta</span><span class="paren">[</span>,.<span class="paren">(</span><span class="identifier">colnames</span>, <span class="identifier">new_chunk</span><span class="paren">)</span><span class="paren">]</span>, </pre>
+                      <pre class="language-r">    <span class="identifier">quo_dotdotdot</span> <span class="operator">=</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">114</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">20</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">metas_df</span><span class="paren">[</span>,.<span class="paren">(</span><span class="identifier">colnames</span><span class="operator">=</span><span class="identifier">unique</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">)</span>, <span class="identifier">existing_df</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"colnames"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">cmap_dfr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">115</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">21</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">quo</span><span class="paren">(</span><span class="identifier">left_join</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="operator">!</span><span class="operator">!</span><span class="operator">!</span><span class="identifier">quo_dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">116</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">22</td>
+                    <td class="coverage">16<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">eval_tidy</span><span class="paren">(</span><span class="identifier">code</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">117</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">23</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">[</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">new_chunk</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">118</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">24</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">119</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">25</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">120</td>
+                    <td class="num">26</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="string">"these variables are in the disk.frame but not in the new chunk:  \n {paste0(check_vars[is.na(new_chunk), colnames], collapse=',\n  ')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">121</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">122</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">28</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">check_vars</span><span class="paren">[</span><span class="identifier">is.na</span><span class="paren">(</span><span class="identifier">existing_df</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">123</td>
+                    <td class="num">29</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"these variables are in the new chunk but not in the existing disk.frame: {paste0(check_vars[is.na(existing_df), colnames], collapse=', ')}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">by</span> <span class="operator">&lt;-</span> <span class="identifier">intersect</span><span class="paren">(</span><span class="identifier">names</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">names</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">124</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">125</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">126</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># find out which vars are matched but the types don't match</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncx</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">127</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">33</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df_summ1</span> <span class="operator">=</span> <span class="identifier">merged_meta</span><span class="paren">[</span><span class="identifier">existing_df</span> <span class="operator">==</span> <span class="literal">TRUE</span> <span class="operator">&amp;</span> <span class="identifier">new_chunk</span> <span class="operator">==</span> <span class="literal">TRUE</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.x</span> <span class="operator">!=</span> <span class="identifier">coltypes.y</span><span class="paren">]</span></pre>
+                      <pre class="language-r">    <span class="identifier">ncy</span> <span class="operator">=</span> <span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">128</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># find incompatible types</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">129</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">35</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df_summ1</span><span class="paren">[</span>, <span class="identifier">incompatible_types</span> <span class="operator">:</span><span class="operator">=</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">warning</span><span class="paren">(</span><span class="string">"merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">130</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">36</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span>, <span class="string">"Date"</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">==</span> <span class="string">"character"</span> <span class="operator">|</span></pre>
+                      <pre class="language-r">      <span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">131</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">37</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">==</span> <span class="string">"character"</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span>, <span class="string">"Date"</span><span class="paren">)</span> <span class="operator">|</span></pre>
+                      <pre class="language-r">      <span class="identifier">y</span> <span class="operator">=</span> <span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">max</span><span class="paren">(</span><span class="identifier">ncy</span>,<span class="identifier">ncx</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">132</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">38</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span><span class="paren">)</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">==</span> <span class="string">"Date"</span> <span class="operator">|</span> </pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">left_join.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="identifier">overwrite</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">133</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">39</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">coltypes.x</span> <span class="operator">==</span> <span class="string">"Date"</span> <span class="operator">&amp;</span> <span class="identifier">coltypes.y</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"integer"</span>, <span class="string">"double"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">==</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">134</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">]</span></pre>
+                      <pre class="language-r">    <span class="comment">#} else if ((identical(shardkey(x)$shardkey, "") &amp; identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">135</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">      <span class="identifier">dotdotdot</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">136</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">42</td>
+                    <td class="coverage">4<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">metas_df_summ2</span> <span class="operator">=</span> <span class="identifier">metas_df_summ1</span><span class="paren">[</span><span class="identifier">incompatible_types</span> <span class="operator">==</span> <span class="literal">TRUE</span>,<span class="paren">]</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap2.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">137</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">        <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">44</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">138</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="num">45</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">metas_df_summ2</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">139</td>
+                    <td class="num">46</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"the belows types are incompatible between the new chunk and the disk.frame; this chunk can not be added\n"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">          <span class="keyword">return</span><span class="paren">(</span><span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">140</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">47</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">utils</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">capture.output</span><span class="paren">(</span><span class="identifier">metas_df_summ2</span><span class="paren">)</span>, <span class="identifier">collapse</span> <span class="operator">=</span> <span class="string">"\n"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">141</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">llj</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">lift</span><span class="paren">(</span><span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">left_join</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">142</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="comment">#left_join(.x, .y, by = by, copy = copy, ...)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">50</td>
+                    <td class="coverage">21<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">        <span class="identifier">llj</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span><span class="operator">=</span><span class="identifier">.x</span>, <span class="identifier">y</span> <span class="operator">=</span><span class="identifier">.y</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span>, <span class="identifier">copy</span> <span class="operator">=</span> <span class="identifier">copy</span><span class="paren">)</span>, <span class="identifier">dotdotdot</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">4<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">143</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">144</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">      <span class="comment"># TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">145</td>
-                    <td class="coverage">24<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">55</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">chunk</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">chunk_id</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">146</td>
-                    <td class="coverage">24<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">56</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">57</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">147</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -25920,850 +29536,829 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/names.r" class="hidden">
+            <div id="R/merge.disk.frame.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Return the column names of the disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' Merge function for disk.frames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' The returned column names are from the source. So if you have lazy operations then the </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' colnames here does not reflects the results of those operations. To obtain the correct names try</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param y a disk.frame or data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' \code{names(collect(get_chunk(df, 1)))}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param by the merge by keys</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir The output directory for the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param merge_by_chunk_id if TRUE then only chunks in df1 and df2 with the same chunk id will get merged</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the outdir or not</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to merge and cmap.disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_ls</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table setDT</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fst metadata_fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' b = as.disk.frame(data.frame(a = 51:150, b = 1:100))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">colnames</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' d = as.disk.frame(data.frame(a = 151:250, b = 1:100))</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">52<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"colnames"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' bd.df = merge(b, d, by = "b", merge_by_chunk_id = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(b)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(d)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">names.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(bd.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">20</td>
-                    <td class="coverage">2<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">colnames.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">merge.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">y</span>, <span class="identifier">by</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">merge_by_chunk_id</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span>  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">21</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
+                      <pre class="language-r">  <span class="comment">#fs::dir_create(outdir)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">colnames.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">"path"</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
+                      <pre class="language-r">    <span class="identifier">yby</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">y</span><span class="operator">=</span><span class="identifier">y</span>, <span class="identifier">by</span><span class="operator">=</span><span class="identifier">by</span><span class="paren">)</span>, <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">27</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">cmap</span><span class="paren">(</span><span class="identifier">x</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">do.call</span><span class="paren">(</span><span class="identifier">merge</span>, <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">x</span> <span class="operator">=</span> <span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">yby</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">5<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">vector</span><span class="paren">(</span><span class="string">"character"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">res</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">31</td>
-                    <td class="coverage">20<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">metadata_fst</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">columnNames</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span>  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">32</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">merge_by_chunk_id</span> <span class="operator">|</span> <span class="identifier">shardkey_equal</span><span class="paren">(</span><span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">shardkey</span><span class="paren">(</span><span class="identifier">y</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="comment"># ifthe shardkeys are the same then only need to match by segment id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="comment"># as account with the same shardkey must end up in the same segment</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">35</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
+                      <pre class="language-r">    <span class="identifier">path1</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">36</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">y</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">colnames.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">38</td>
-                    <td class="coverage">34<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">df3</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">39</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/collect.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">40</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into R</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">        <span class="identifier">pathA</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into RAM by loading the data and running all lazy</span></pre>
+                      <pre class="language-r">      <span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' operations as data.table/data.frame or as a list</span></pre>
+                      <pre class="language-r">      <span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">44</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r">        <span class="identifier">chunk_id</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span>, </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">45</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param parallel if TRUE the collection is performed in parallel. By default</span></pre>
+                      <pre class="language-r">        <span class="identifier">pathB</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path2</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   if there are delayed/lazy steps then it will be parallel, otherwise it will</span></pre>
+                      <pre class="language-r">      <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   not be in parallel. This is because parallel requires transferring data</span></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   from background R session to the current R session and if there is no</span></pre>
+                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df3</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">df3</span><span class="paren">[</span>,<span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">50</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">data1</span> <span class="operator">=</span> <span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">pathA</span>,<span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">51</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">data2</span> <span class="operator">=</span> <span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">pathB</span>,<span class="identifier">as.data.table</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">data3</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">merge</span><span class="paren">(</span><span class="identifier">data1</span>, <span class="identifier">data2</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="identifier">by</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">53</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data1</span><span class="paren">)</span>; <span class="identifier">rm</span><span class="paren">(</span><span class="identifier">data2</span><span class="paren">)</span>; <span class="identifier">gc</span><span class="paren">(</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">data3</span>, <span class="identifier">glue</span><span class="paren">(</span><span class="string">"{outdir}/{.BY}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">5<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">56</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="paren">}</span>, <span class="identifier">chunk_id</span><span class="paren">]</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   computation then it's better to avoid transferring data between session,</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   hence parallel = FALSE is a better choice</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">12</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"Cartesian joins are currently not implemented. Either make y a data.frame or set merge_by_chunk_id to TRUE"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">60</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table as.data.table</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom furrr future_map_dfr future_options</span></pre>
+                      <pre class="language-r">    <span class="comment"># have to make every possible combination</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_dfr</span></pre>
+                      <pre class="language-r">    <span class="comment"># path1 = attr(df1,"path")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr collect select mutate</span></pre>
+                      <pre class="language-r">    <span class="comment"># path2 = attr(df2,"path")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">64</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return collect return a data.frame/data.table</span></pre>
+                      <pre class="language-r">    <span class="comment"># </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="comment"># df3 = merge(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="comment">#   data.table(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # use collect to bring the data into RAM as a data.table/data.frame</span></pre>
+                      <pre class="language-r">    <span class="comment">#     justmerge = TRUE,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(cars.df)</span></pre>
+                      <pre class="language-r">    <span class="comment">#     chunk_id1 = list.files(path1), </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">    <span class="comment">#     pathA = list.files(path1,full.names = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r">    <span class="comment">#   ),</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">    <span class="comment">#   data.table(</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">72</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="comment">#     justmerge = TRUE,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">26</td>
+                    <td class="num">73</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname collect</span></pre>
+                      <pre class="language-r">    <span class="comment">#     chunk_id2 = list.files(path2), </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">74</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">collect.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"lazyfn"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">86<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">cids</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#     pathB = list.files(path2,full.names = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">75</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#cids = as.integer(get_chunk_ids(x))</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">86<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">31</td>
-                    <td class="coverage">83<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment">#   ),</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#furrr::future_map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE), .options = furrr::future_options(packages = "disk.frame"))</span></pre>
+                      <pre class="language-r">    <span class="comment">#   by = "justmerge",</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">77</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#furrr::future_map_dfr(cids, ~disk.frame::get_chunk(x, .x, full.names = TRUE))</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">35<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map_dfr</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment">#   all=TRUE,</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">78</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#purrr::map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE))</span></pre>
+                      <pre class="language-r">    <span class="comment">#   allow.cartesian = TRUE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">79</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#purrr::map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE))</span></pre>
+                      <pre class="language-r">    <span class="comment"># )</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">80</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#future.apply::future_lapply(chunk_ids, function(.x) disk.frame::get_chunk(x, .x))</span></pre>
+                      <pre class="language-r">    <span class="comment"># </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">81</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#lapply(chunk_ids, function(chunk) get_chunk(x, chunk)) %&gt;% rbindlist</span></pre>
+                      <pre class="language-r">    <span class="comment"># </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">48<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># setDT(df3)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">83</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="comment"># i &lt;- 0</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">84</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">3<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">data.table</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="comment"># mapply(function(pathA, pathB) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">85</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="comment">#   stop("error")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">86</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="comment">#   data1 = read_fst(pathA,as.data.table = TRUE, columns = c("ACCOUNT_ID","MONTH_KEY"))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">87</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="comment">#   data2 = read_fst(pathB,as.data.table = TRUE, columns = c("ACCOUNT_ID","MONTH_KEY"))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">88</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param simplify Should the result be simplified to array</span></pre>
+                      <pre class="language-r">    <span class="comment">#   data3 = merge(data1, data2, ...)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">89</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="comment">#   rm(data1); rm(data2); gc()</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">90</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname collect</span></pre>
+                      <pre class="language-r">    <span class="comment">#   if(nrow(data3) &gt; 0) {</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">91</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return collect_list returns a list</span></pre>
+                      <pre class="language-r">    <span class="comment">#     i &lt;&lt;- i + 1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">92</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="comment">#     write_fst(data3, glue("{outdir}/{i}.fst"))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">93</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="comment">#   }</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">94</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    <span class="comment">#   NULL</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">95</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # returns the result as a list</span></pre>
+                      <pre class="language-r">    <span class="comment"># },df3$pathA, df3$pathB)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">96</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect_list(map(cars.df, ~1))</span></pre>
+                      <pre class="language-r">    <span class="comment"># return(disk.frame(outdir))</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">97</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">98</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/print.disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Print disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">collect_list</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">simplify</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"lazyfn"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">cids</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' a new print method for disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">62</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">63</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">64</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">&lt;-</span> <span class="literal">NULL</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">65</td>
-                    <td class="coverage">1<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#res = furrr::future_map(1:nchunks(x), ~get_chunk(x, .x))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">67</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">future.apply</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_lapply</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">68</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">69</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment"># TODO add chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">print.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">71</td>
+                    <td class="num">10</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">cids</span>, <span class="operator">~</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">a</span> <span class="operator">=</span> <span class="identifier">paste</span><span class="paren">(</span><span class="identifier">sep</span> <span class="operator">=</span> <span class="string">"\n"</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">72</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">11</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"path: \"{attr(x,'path', exact=TRUE)}\""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">73</td>
+                    <td class="num">12</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">simplify</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nchunks: {disk.frame::nchunks(x)}"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">74</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">13</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">simplify2array</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow (at source): {disk.frame::nrow(x)}"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">75</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">14</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"ncol (at source): {disk.frame::ncol(x)}"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">76</td>
+                    <td class="num">15</td>
                     <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow (post operations): ???"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">77</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">16</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">             ,<span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"ncol (post operations): ???\n"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">79</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">list</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">80</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">18</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">message</span><span class="paren">(</span><span class="identifier">a</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">81</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -26772,98 +30367,98 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/map2.r" class="hidden">
+            <div id="R/map-deprecated.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' `map` a function to two disk.frames</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Perform a function on both disk.frames .x and .y, each chunk of .x and .y</span></pre>
+                      <pre class="language-r"><span class="identifier">map</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">4</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">76<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' gets run by .f(x.chunk, y.chunk)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .x a disk.frame</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .y a disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .f a function to be called on each chunk of x and y matched by</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   chunk_id</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r"><span class="identifier">map.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">10</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir output directory</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"map(df, ...) where df is a disk.frame has been deprecated. Please use cmap(df,...) instead"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">11</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import stringr fst</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr as_mapper map2</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -26877,892 +30472,969 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="identifier">map.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">17</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">76<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2.df = map2(cars.df, cars.df, ~data.table::rbindlist(list(.x, .y)))</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(cars2.df)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">imap_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">24</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map2</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"imap_dfr"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">25</td>
-                    <td class="coverage">14<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map2"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map2.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">imap_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">30</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map2</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">.y</span>,<span class="identifier">.f</span>,<span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"imap_dfr(df, ...) where df is disk.frame is deprecated. Please use cimap_dfr(df, ...) instead"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">31</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">cimap_dfr.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom assertthat assert_that</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom pryr do_call</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map2.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">imap_dfr.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">37</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">assertthat</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">assert_that</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">msg</span> <span class="operator">=</span> <span class="string">"running map2.disk.frame(.x,.y, ...): the .x argument must be a disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap_dfr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="identifier">.id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">38</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">.f</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_mapper</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">41</td>
-                    <td class="coverage">26<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">42</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_create</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># get all the chunk ids</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">45</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">xc</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # .x is the chunk and .y is the ID as an integer</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">46</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">xc</span><span class="paren">[</span>,<span class="identifier">xid</span><span class="operator">:</span><span class="operator">=</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">47</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">yc</span> <span class="operator">=</span> <span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">cid</span> <span class="operator">=</span> <span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.y</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # lazy = TRUE support is not available at the moment</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">48</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">yc</span><span class="paren">[</span>,<span class="identifier">yid</span><span class="operator">:</span><span class="operator">=</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">.y</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' cimap(cars.df, ~.x[, id := .y], lazy = FALSE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">50</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">xyc</span> <span class="operator">=</span> <span class="identifier">merge</span><span class="paren">(</span><span class="identifier">xc</span>, <span class="identifier">yc</span>, <span class="identifier">by</span><span class="operator">=</span><span class="string">"cid"</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">allow.cartesian</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cimap_dfr(cars.df, ~.x[, id := .y])</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">52</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># apply the functions</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">imap</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">55</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#future.apply::future_mapply(function(xid, yid, outid) {</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"imap"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#mapply(function(xid, yid, outid) {</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">57</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_pmap</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">xid</span>, <span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">yid</span>, <span class="identifier">xyc</span><span class="operator">$</span><span class="identifier">cid</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">xid</span>, <span class="identifier">yid</span>, <span class="identifier">outid</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">58</td>
-                    <td class="coverage">126<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">xch</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">xid</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">imap.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">59</td>
-                    <td class="coverage">126<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">ych</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">.y</span>, <span class="identifier">yid</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"imap(df,..) where df is disk.frame is deprecated. Use cimap(df, ...) instead"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">60</td>
-                    <td class="coverage">126<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">xych</span> <span class="operator">=</span> <span class="identifier">.f</span><span class="paren">(</span><span class="identifier">xch</span>, <span class="identifier">ych</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">cimap.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">61</td>
-                    <td class="coverage">126<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">xych</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">62</td>
-                    <td class="coverage">111<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">xych</span>, <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">outid</span>,<span class="string">".fst"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">64</td>
-                    <td class="coverage">15<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"one of the chunks, {xid}, is empty"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">65</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="identifier">imap.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">66</td>
-                    <td class="coverage">126<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="literal">NULL</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">imap</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">68</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#,xyc$xid, xyc$yid, xyc$cid # together with mapply</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">69</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    , <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">70</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param .id not used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">71</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">72</td>
-                    <td class="coverage">25<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">map_dfr.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">73</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"map_dfr(df, ...) where df is disk.frame is deprecated. Please use cmap_dfr instead"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">74</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if .y is not a disk.frame</span></pre>
+                      <pre class="language-r">  <span class="identifier">cmap_dfr.disk.frame</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">75</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="string">"in map2(.x,.y,...) the .y is not a disk.frame, so returning a list instead of a disk.frame"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">76</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">77</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">f_for_passing</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">.f</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">map_dfr</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">78</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">list</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"map_dfr"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">79</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp_disk.frame</span> <span class="operator">=</span> <span class="identifier">force</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">80</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map2</span><span class="paren">(</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">tmp_disk.frame</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">.y</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">xs</span>, <span class="identifier">ys</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">81</td>
-                    <td class="coverage">5<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">ddd</span> <span class="operator">=</span> <span class="identifier">c</span><span class="paren">(</span><span class="identifier">list</span><span class="paren">(</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">tmp_disk.frame</span>, <span class="identifier">xs</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">ys</span><span class="paren">)</span>, <span class="identifier">ddd</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">82</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">83</td>
-                    <td class="coverage">5<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">pryr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">do_call</span><span class="paren">(</span><span class="identifier">f_for_passing</span>, <span class="identifier">ddd</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">map_dfr.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">84</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">.id</span> <span class="operator">=</span> <span class="identifier">.id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">85</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">86</td>
-                    <td class="coverage">1<em>x</em></td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/hard_arrange.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Perform a hard arrange</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">87</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">88</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' A hard_arrange is a sort by that also reorganizes the chunks to ensure that</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">89</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' every unique grouping of `by`` is in the same chunk. Or in other words, every</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">90</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname map2</span></pre>
+                      <pre class="language-r"><span class="comment">#' row that share the same `by` value will end up in the same chunk.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">91</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">map_by_chunk_id</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">92</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"map_by_chunk_id is deprecated. Use map2 instead"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... grouping variables</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">93</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">map2.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">94</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/make_glm_streaming_fn.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the out put directory</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param add same as dplyr::arrange</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @param .drop same as dplyr::arrange</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">14</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' iris.df = as.disk.frame(iris, nchunks = 2)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' # arrange iris.df by specifies and ensure rows with the same specifies are in the same chunk</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' iris_hard.df = hard_arrange(iris.df, Species)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' </span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' A streaming function for speedglm</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 1)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk(iris_hard.df, 2)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Define a function that can be used to feed data into speedglm and biglm</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param data a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param verbose Whether to print the status of data loading. Default to FALSE</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(iris_hard.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="identifier">hard_arrange</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">add</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">.drop</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">27</td>
+                    <td class="coverage">9<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"hard_arrange"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @return return a function, fn, that can be used as the data argument in biglm::bigglm or speedglm::shglm</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @family Machine Learning (ML)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname hard_arrange</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr arrange</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="identifier">hard_arrange.data.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">14</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">34</td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">  <span class="identifier">dplyr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">arrange</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">15</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' streamacq = make_glm_streaming_fn(cars.df, verbose = FALSE)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' m = biglm::bigglm(dist ~ speed, data = streamacq)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' summary(m)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname hard_arrange</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' predict(m, get_chunk(cars.df, 1))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' predict(m, collect(cars.df, 1))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">make_glm_streaming_fn</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">verbose</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">hard_arrange.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_disk_frame_hard_arrange"</span><span class="paren">)</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">21</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">41</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">i</span> <span class="operator">=</span> <span class="number">0</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">23</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">43</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">chunkids</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">get_chunk_ids</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># Refer also to Dplyr arrange: https://github.com/tidyverse/dplyr/blob/master/src/arrange.cpp</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">24</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">44</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">is</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">chunkids</span><span class="paren">)</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">q</span> <span class="operator">&lt;-</span> <span class="identifier">enquos</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">25</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">45</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">verbose</span> <span class="operator">=</span> <span class="identifier">verbose</span></pre>
+                      <pre class="language-r">  <span class="identifier">is_sym</span> <span class="operator">&lt;-</span> <span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">q</span>, <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">quo_is_symbol</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">26</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">46</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">nchunks_copy</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">chunkids</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">arrange_codes</span> <span class="operator">&lt;-</span> <span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">q</span>, <span class="identifier">rlang</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">as_label</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">28</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">48</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">function</span><span class="paren">(</span><span class="identifier">reset</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="comment"># Check if desc...</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">29</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">reset</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">is_desc</span> <span class="operator">&lt;-</span> <span class="identifier">substr</span><span class="paren">(</span><span class="identifier">arrange_codes</span>, <span class="number">1</span>, <span class="number">5</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"desc("</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">30</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">50</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">verbose</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">31</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">51</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="string">"disk.frame stream has been reset; next read will be from beginning"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="comment"># If expr is a symbol from the data, just use it.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="comment"># Otherwise need to evaluate ... </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">  <span class="comment"># (TODO - currently only support variables and desc in the data)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">34</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">54</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">i</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="number">0</span></pre>
+                      <pre class="language-r">  <span class="comment"># Peels off "desc" from the original</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">55</td>
+                    <td class="coverage">6<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">vars</span> <span class="operator">&lt;-</span> <span class="identifier">sub</span><span class="paren">(</span><span class="string">")"</span>, <span class="string">""</span>, <span class="identifier">sub</span><span class="paren">(</span><span class="string">"desc("</span>, <span class="string">""</span>, <span class="identifier">arrange_codes</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span>, <span class="identifier">fixed</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">36</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">i</span> <span class="operator">&lt;</span><span class="operator">&lt;-</span> <span class="identifier">i</span> <span class="operator">+</span> <span class="number">1</span></pre>
+                      <pre class="language-r">  <span class="identifier">desc_vars</span> <span class="operator">&lt;-</span> <span class="identifier">vars</span><span class="paren">[</span><span class="identifier">is_desc</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">38</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">i</span> <span class="operator">&gt;</span> <span class="identifier">nchunks_copy</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">vars</span> <span class="operator">%in%</span> <span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
-                    <td class="num">39</td>
+                    <td class="num">60</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="keyword">return</span><span class="paren">(</span><span class="literal">NULL</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">paste0</span><span class="paren">(</span><span class="string">"Expressions currently not supported. Columns not found in colnames:"</span>, <span class="identifier">vars</span><span class="paren">[</span><span class="operator">!</span><span class="identifier">vars</span> <span class="operator">%in%</span> <span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">verbose</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">42</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">62</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">print</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"streaming: {i}/{nchunks_copy}; chunk id: {chunkids[i]}"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="comment"># Hard group by in a partially sorted way at the chunk level and then arrange within chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">64</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">get_chunk</span><span class="paren">(</span><span class="identifier">data</span>, <span class="identifier">chunkids</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">df</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">45</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">disk.frame</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">hard_group_by</span><span class="paren">(</span><span class="identifier">vars</span>, <span class="identifier">outdir</span><span class="operator">=</span><span class="identifier">outdir</span>, <span class="identifier">nchunks</span><span class="operator">=</span><span class="identifier">nchunks</span>, <span class="identifier">overwrite</span><span class="operator">=</span><span class="identifier">overwrite</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"sort"</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span> <span class="operator">%&gt;%</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">46</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">66</td>
+                    <td class="coverage">6<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="identifier">chunk_arrange</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">67</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -27771,850 +31443,787 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/nchunks.r" class="hidden">
+            <div id="R/shard.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Returns the number of chunks in a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' Shard a data.frame/data.table or disk.frame into chunk and saves it into a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df A data.frame/data.table or disk.frame. If disk.frame, then rechunk(df, ...) is run</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param skip.ready.check NOT implemented</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby The column(s) to shard the data by.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks The number of chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir The output directory of the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite If TRUE then the chunks are overwritten</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @param sort_splits If shardby_function is "sort", the split values for sharding</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the number of chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param desc_vars for the "sort" shardby function, the variables to sort descending.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunks(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' nchunk(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table setDT</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom glue glue</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nchunks</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">267<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nchunks"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # shard the cars data.frame by speed so that rows with the same speed are in the same chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' iris.df = shard(iris, "Species")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(iris.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="identifier">shard</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="keyword">...</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="string">"hash"</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="literal">NULL</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="literal">NULL</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">241<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nchunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">force</span><span class="paren">(</span><span class="identifier">nchunks</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">23</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="coverage">241<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nchunk"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">24</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">241<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">%in%</span> <span class="identifier">c</span><span class="paren">(</span><span class="string">"hash"</span>, <span class="string">"sort"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">241<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">27</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nchunk.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"hash"</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="coverage">213<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">nchunks.disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">message</span><span class="paren">(</span><span class="string">"Hashing..."</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">213<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">31</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">161<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := hashstr2i(as.character({shardby}), nchunks)]"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_ls</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">33</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname nchunks</span></pre>
+                      <pre class="language-r">        <span class="identifier">shardby_list</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"paste0({paste0(sort(shardby),collapse=',')})"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">34</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">52<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := hashstr2i({shardby_list}, nchunks)]"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">nchunks.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">skip.ready.check</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">36</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">27<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#if(!skip.ready.check) stopifnot(is_ready(df))</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">shardby_function</span> <span class="operator">==</span> <span class="string">"sort"</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">37</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">27<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fpath</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">nchunks</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">38</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.dir.disk.frame</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"Only one chunk: set .out.disk.frame.id = 0"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">39</td>
-                    <td class="coverage">654<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">fpath</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := 0]"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">41</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="number">1</span><span class="paren">)</span></pre>
+                      <pre class="language-r">        <span class="identifier">shard_by_rule</span> <span class="operator">&lt;-</span> <span class="identifier">sortablestr2i</span><span class="paren">(</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">42</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="identifier">shard_by_rule</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">43</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
-                    </td>
-                  </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/rbindlist.disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' rbindlist disk.frames together</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df_list A list of disk.frames</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir Output directory of the row-bound disk.frames</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">4</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param by_chunk_id If TRUE then only the chunks with the same chunk IDs will be bound</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">5</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param parallel if TRUE then bind multiple disk.frame simultaneously, Defaults to TRUE</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">6</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress 0-100, 100 being the highest compression rate.</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">7</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite overwrite the output directory</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">10</td>
-                    <td class="coverage"></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table setDT</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">11</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">26<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future.apply future_lapply</span></pre>
+                      <pre class="language-r">        <span class="identifier">code</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"df[,.out.disk.frame.id := {shard_by_rule}]"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_chr map_dfr map map_lgl</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom purrr map</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">46</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom assertthat assert_that</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">15</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">47</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="keyword">tryCatch</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">16</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">48</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">      <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span><span class="operator">=</span><span class="identifier">code</span><span class="paren">)</span><span class="paren">)</span>,</pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">49</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">      <span class="identifier">error</span> <span class="operator">=</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">e</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">18</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">50</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"error occurred in shard"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # row-bind two disk.frames</span></pre>
+                      <pre class="language-r">      <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">52</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars2.df = rbindlist.disk.frame(list(cars.df, cars.df))</span></pre>
+                      <pre class="language-r">    <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">21</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">22</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">54</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">    <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">".out.disk.frame.id"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">    </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">24</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">56</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars2.df)</span></pre>
+                      <pre class="language-r">    <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span>  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">25</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">57</td>
+                    <td class="coverage">240<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">rbindlist.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">by_chunk_id</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span><span class="operator">=</span><span class="number">50</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">26</td>
-                    <td class="coverage">55<em>x</em></td>
+                    <td class="num">58</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">assertthat</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">assert_that</span><span class="paren">(</span><span class="identifier">typeof</span><span class="paren">(</span><span class="identifier">df_list</span><span class="paren">)</span> <span class="operator">==</span> <span class="string">"list"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span> <span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">27</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">59</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="identifier">nchunks_rechunk</span> <span class="operator">=</span> <span class="identifier">nchunks</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">28</td>
-                    <td class="coverage">55<em>x</em></td>
+                    <td class="num">60</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">rechunk</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks_rechunk</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby_function</span><span class="operator">=</span><span class="identifier">shardby_function</span>, <span class="identifier">sort_splits</span><span class="operator">=</span><span class="identifier">sort_splits</span>, <span class="identifier">desc_vars</span><span class="operator">=</span><span class="identifier">desc_vars</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">29</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">30</td>
-                    <td class="coverage">55<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">62</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="operator">~</span><span class="identifier">assertthat</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">assert_that</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>, <span class="identifier">msg</span> <span class="operator">=</span> <span class="string">"error running rbindlist.disk.frame: Not every element of df_list is a disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">63</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">32</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">64</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">by_chunk_id</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' `distribute` is an alias for `shard`</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">33</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">65</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">list_of_paths</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_chr</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="operator">~</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">34</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">66</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">list_of_chunks</span> <span class="operator">=</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">list_of_paths</span>, <span class="operator">~</span><span class="identifier">data.table</span><span class="paren">(</span><span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span>,<span class="identifier">full_path</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname shard</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">35</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">67</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">list_of_chunks</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">distribute</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">36</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">68</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"shard"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">69</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># split the list of chunks into lists for easy operation with future</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">38</td>
-                    <td class="coverage">54<em>x</em></td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/as.disk.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">slist</span> <span class="operator">=</span> <span class="identifier">split</span><span class="paren">(</span><span class="identifier">list_of_chunks</span><span class="operator">$</span><span class="identifier">full_path</span>,<span class="identifier">list_of_chunks</span><span class="operator">$</span><span class="identifier">path</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Make a data.frame into a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">parallel</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#system.time(future.apply::future_lapply(1:length(slist), function(i) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">42</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">if</span><span class="paren">(</span><span class="identifier">.progress</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite if TRUE the outdir will be overwritten, if FALSE it will throw an error if the directory is not empty</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">43</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">message</span><span class="paren">(</span><span class="string">"Appending disk.frames: "</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param compress the compression level 0-100; 100 is highest</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param shardby The shardkey</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">45</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">system.time</span><span class="paren">(</span><span class="identifier">furrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">future_map</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to output_disk.frame</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">46</td>
-                    <td class="coverage">275<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">full_paths1</span> <span class="operator">=</span> <span class="identifier">slist</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">47</td>
-                    <td class="coverage">275<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">outfilename</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table setDT</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">48</td>
-                    <td class="coverage">275<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">11</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">full_paths1</span>, <span class="operator">~</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span>,<span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>,<span class="identifier">outfilename</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">49</td>
-                    <td class="coverage">275<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">12</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">50</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">13</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span>, <span class="identifier">.progress</span> <span class="operator">=</span> <span class="identifier">.progress</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # write to temporary location</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars) </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">52</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">15</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">system.time</span><span class="paren">(</span><span class="identifier">lapply</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">)</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">i</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">53</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">full_paths1</span> <span class="operator">=</span> <span class="identifier">slist</span><span class="paren">[</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">]</span></pre>
+                      <pre class="language-r"><span class="comment">#' # specify a different path in the temporary folder, you are free to choose a different folder</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">54</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">17</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">outfilename</span> <span class="operator">=</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">slist</span><span class="paren">[</span><span class="identifier">i</span><span class="paren">]</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars_new_location.df = as.disk.frame(cars, outdir = file.path(tempdir(), "some_path.df"))</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">55</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">18</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">write_fst</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_dfr</span><span class="paren">(</span><span class="identifier">full_paths1</span>, <span class="operator">~</span><span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">read_fst</span><span class="paren">(</span><span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span>,<span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">outdir</span>,<span class="identifier">outfilename</span><span class="paren">)</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">56</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">19</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="comment">#' # specify a different number of chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # this writes to tempdir() by default</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars_chunks.df = as.disk.frame(cars, nchunks = 4, overwrite = TRUE) </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">60</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">23</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">rbind_res</span> <span class="operator">=</span> <span class="identifier">disk.frame</span><span class="paren">(</span><span class="identifier">outdir</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">61</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">62</td>
-                    <td class="coverage">54<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">25</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shardkeys</span> <span class="operator">&lt;-</span> <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map</span><span class="paren">(</span><span class="identifier">df_list</span>, <span class="identifier">shardkey</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars_new_location.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars_chunks.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># if all the sharkeys are identical then</span></pre>
+                      <pre class="language-r"><span class="identifier">as.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>,<span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">##browser</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">66</td>
-                    <td class="coverage">54<em>x</em></td>
+                    <td class="num">29</td>
+                    <td class="coverage">72<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">all</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">shardkeys</span><span class="paren">[</span><span class="operator">-</span><span class="number">1</span><span class="paren">]</span>, <span class="operator">~</span><span class="identifier">identical</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">67</td>
-                    <td class="coverage">54<em>x</em></td>
+                    <td class="num">30</td>
+                    <td class="coverage">72<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">add_meta</span><span class="paren">(</span><span class="identifier">rbind_res</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">68</td>
-                    <td class="coverage">54<em>x</em></td>
+                    <td class="num">31</td>
+                    <td class="coverage">71<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="identifier">shardkey</span> <span class="operator">=</span> <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="operator">$</span><span class="identifier">shardkey</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">32</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">69</td>
-                    <td class="coverage">54<em>x</em></td>
+                    <td class="num">33</td>
+                    <td class="coverage">71<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="identifier">shardchunks</span> <span class="operator">=</span> <span class="identifier">shardkeys</span><span class="paren">[</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">]</span><span class="operator">$</span><span class="identifier">shardchunks</span>, </pre>
+                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">70</td>
-                    <td class="coverage">54<em>x</em></td>
+                    <td class="num">34</td>
+                    <td class="coverage">70<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">               <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">odfi</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nchunks</span>, <span class="identifier">each</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="operator">/</span><span class="identifier">nchunks</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">71</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">35</td>
+                    <td class="coverage">70<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="identifier">odfi</span> <span class="operator">=</span> <span class="identifier">odfi</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">72</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">70<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">rbind_res</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">df</span><span class="paren">[</span>, <span class="identifier">.out.disk.frame.id</span> <span class="operator">:</span><span class="operator">=</span> <span class="identifier">odfi</span><span class="paren">]</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">    </pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">70<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span><span class="operator">=</span><span class="string">""</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">75</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">40</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"For rbindlist.disk.frame, only by_chunk_id = TRUE is implemented"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -28623,14 +32232,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/as.disk.frame.r" class="hidden">
+            <div id="R/remove_chunk.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Make a data.frame into a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' Removes a chunk from the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -28644,277 +32253,291 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param chunk_id the chunk ID of the chunk to remove. If it's a number then return number.fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param nchunks number of chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param full.names TRUE or FALSE. Defaults to FALSE. If true then chunk_id is the full path to the chunk otherwise it's the relative path</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param overwrite if TRUE the outdir will be overwritten, if FALSE it will throw an error if the directory is not empty</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param compress the compression level 0-100; 100 is highest</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param shardby The shardkey</span></pre>
+                      <pre class="language-r"><span class="comment">#' # TODO add these to tests</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to output_disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars, nchunks = 4)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom data.table setDT</span></pre>
+                      <pre class="language-r"><span class="comment">#' # removes 3rd chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, 3)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 3</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # write to temporary location</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars) </span></pre>
+                      <pre class="language-r"><span class="comment">#' # removes 4th chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, "4.fst")</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # specify a different path in the temporary folder, you are free to choose a different folder</span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 3</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars_new_location.df = as.disk.frame(cars, outdir = file.path(tempdir(), "some_path.df"))</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # removes 2nd chunk</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # specify a different number of chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' remove_chunk(cars.df, file.path(attr(cars.df, "path", exact=TRUE), "2.fst"), full.names = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # this writes to tempdir() by default</span></pre>
+                      <pre class="language-r"><span class="comment">#' nchunks(cars.df) # 1</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars_chunks.df = as.disk.frame(cars, nchunks = 4, overwrite = TRUE) </span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">remove_chunk</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">chunk_id</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars_new_location.df)</span></pre>
+                      <pre class="language-r">  <span class="identifier">filename</span> <span class="operator">=</span> <span class="string">""</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars_chunks.df)</span></pre>
+                      <pre class="language-r">  <span class="identifier">path</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">27</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">as.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="identifier">fileext</span> <span class="operator">=</span> <span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">recommend_nchunks</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="number">50</span>,<span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">is.numeric</span><span class="paren">(</span><span class="identifier">chunk_id</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"{as.integer(chunk_id)}.fst"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">29</td>
-                    <td class="coverage">74<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"data.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">30</td>
-                    <td class="coverage">74<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">31</td>
-                    <td class="coverage">73<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">data.table</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">setDT</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">chunk_id</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="missed">
                     <td class="num">33</td>
-                    <td class="coverage">73<em>x</em></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span> <span class="paren">(</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">shardby</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">filename</span> <span class="operator">=</span> <span class="identifier">file.path</span><span class="paren">(</span><span class="identifier">path</span>, <span class="identifier">chunk_id</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">34</td>
-                    <td class="coverage">72<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">odfi</span> <span class="operator">=</span> <span class="identifier">rep</span><span class="paren">(</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nchunks</span>, <span class="identifier">each</span> <span class="operator">=</span> <span class="identifier">ceiling</span><span class="paren">(</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="operator">/</span><span class="identifier">nchunks</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">35</td>
-                    <td class="coverage">72<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">odfi</span> <span class="operator">=</span> <span class="identifier">odfi</span><span class="paren">[</span><span class="number">1</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">]</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">36</td>
-                    <td class="coverage">72<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">df</span><span class="paren">[</span>, <span class="identifier">.out.disk.frame.id</span> <span class="operator">:</span><span class="operator">=</span> <span class="identifier">odfi</span><span class="paren">]</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r">  <span class="comment">#if(filename %in% fs::dir_ls(path, glob="*.fst")) {</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">38</td>
-                    <td class="coverage">72<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">outdir</span>, <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">shardby</span><span class="operator">=</span><span class="string">""</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_exists</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">39</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">file_delete</span><span class="paren">(</span><span class="identifier">filename</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">40</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">40</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">41</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shard</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">shardby</span> <span class="operator">=</span> <span class="identifier">shardby</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">nchunks</span> <span class="operator">=</span> <span class="identifier">nchunks</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="identifier">compress</span> <span class="operator">=</span> <span class="identifier">compress</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">warning</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"the chunk {filename} does not exist and hence can't be removed; make sure you suffix the file with the .fst extension"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
+                  <tr class="covered">
+                    <td class="num">43</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">df</span></pre>
+                    </td>
+                  </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">44</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -28923,321 +32546,404 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/get_chunk_ids.r" class="hidden">
+            <div id="R/is_disk.frame.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Get the chunk IDs and files names</span></pre>
+                      <pre class="language-r"><span class="comment">#' Checks if a folder is a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame or directory to check </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param full.names If TRUE returns the full path to the file, Defaults to FALSE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param strip_extension If TRUE then the file extension in the chunk_id is removed. Defaults to TRUE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to list.files</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom stringr fixed</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' is_disk.frame(cars) # FALSE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="comment">#' is_disk.frame(cars.df) # TRUE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the integer-string chunk IDs</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">is_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="comment">##browser</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">14</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">759<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the file name chunk IDs</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">15</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">31<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df, full.names = TRUE)</span></pre>
+                      <pre class="language-r">    <span class="identifier">df</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">16</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">728<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="string">"character"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># character then check the path</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">17</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">310<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # return the file name chunk IDs with file extension</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df, strip_extension = FALSE)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">20</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">449<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r">  <span class="identifier">files</span> <span class="operator">&lt;-</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span>, <span class="identifier">all</span>  <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">  <span class="comment"># if all files are fst</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">449<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">get_chunk_ids</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">files</span><span class="paren">)</span><span class="operator">&gt;</span><span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">23</td>
-                    <td class="coverage">272<em>x</em></td>
+                    <td class="coverage">32<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">lf</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="identifier">full.names</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">any</span><span class="paren">(</span><span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_lgl</span><span class="paren">(</span><span class="identifier">files</span>, <span class="operator">~</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">grep</span><span class="paren">(</span><span class="identifier">glob2rx</span><span class="paren">(</span><span class="string">"*.fst"</span><span class="paren">)</span>, <span class="identifier">.x</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">24</td>
-                    <td class="coverage">272<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="comment"># some of the fiels do not have a .fst extension</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage">214<em>x</em></td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">lf</span><span class="paren">)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">27</td>
-                    <td class="coverage">58<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_chr</span><span class="paren">(</span><span class="identifier">lf</span>, <span class="operator">~</span><span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">28</td>
-                    <td class="coverage">301<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">tmp</span> <span class="operator">=</span> <span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">str_split</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fixed</span><span class="paren">(</span><span class="string">"."</span><span class="paren">)</span>, <span class="identifier">simplify</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage">301<em>x</em></td>
+                    <td class="coverage">448<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">dirs</span> <span class="operator">=</span> <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">type</span><span class="operator">=</span><span class="string">"directory"</span>, <span class="identifier">all</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage">301<em>x</em></td>
+                    <td class="coverage">448<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">l</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span> <span class="operator">&gt;</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">31</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">32</td>
-                    <td class="coverage">301<em>x</em></td>
+                    <td class="coverage">448<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">strip_extension</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">33</td>
-                    <td class="coverage">269<em>x</em></td>
+                    <td class="coverage">13<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">[</span><span class="operator">-</span><span class="identifier">l</span><span class="paren">]</span>, <span class="identifier">collapse</span><span class="operator">=</span><span class="string">""</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">substr</span><span class="paren">(</span><span class="identifier">dirs</span>, <span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span><span class="operator">-</span><span class="number">8</span>,<span class="identifier">nchar</span><span class="paren">(</span><span class="identifier">dirs</span><span class="paren">)</span><span class="paren">)</span> <span class="operator">!=</span> <span class="string">".metadata"</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">34</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="literal">FALSE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">35</td>
-                    <td class="coverage">32<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">.x</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">38</td>
+                    <td class="coverage">448<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">return</span><span class="paren">(</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                  <tr class="never">
+                    <td class="num">40</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
                 </tbody>
               </table>
             </div>
-            <div id="R/setup.r" class="hidden">
+            <div id="R/sample_n.R" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Set up disk.frame environment</span></pre>
+                      <pre class="language-r"><span class="identifier">sample_n.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">size</span> <span class="operator">=</span> <span class="number">1</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">weight</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">.env</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span><span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">2</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">stop</span><span class="paren">(</span><span class="string">"not implemented yet"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">3</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">weight</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">4</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"sample_n(..., weight =) is not implemented yet"</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">6</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="comment">#delayed(df, ~sample_frac(.x, size, replace, weight, .env))</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/get_chunk_ids.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' Get the chunk IDs and files names</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param workers the number of workers (background R processes in the</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param future_backend which future backend to use for parallelization</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param full.names If TRUE returns the full path to the file, Defaults to FALSE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param gui Whether to use a Graphical User Interface (GUI) for selecting the options. Defaults to FALSE</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param strip_extension If TRUE then the file extension in the chunk_id is removed. Defaults to TRUE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to `future::plan`</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to list.files</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future plan multiprocess nbrOfWorkers sequential</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stringr fixed</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -29251,77 +32957,77 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' if (interactive()) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   # setup disk.frame to use multiple workers these may use more than two</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   # cores, and is therefore not allowed on CRAN. Hence it's set to run only in</span></pre>
+                      <pre class="language-r"><span class="comment">#' # return the integer-string chunk IDs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   # interactive session</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   setup_disk.frame()</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   </span></pre>
+                      <pre class="language-r"><span class="comment">#' # return the file name chunk IDs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   # use a Shiny GUI to adjust settings</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df, full.names = TRUE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   # only run in interactive()</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#'   setup_disk.frame(gui = TRUE)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # return the file name chunk IDs with file extension</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' }</span></pre>
+                      <pre class="language-r"><span class="comment">#' get_chunk_ids(cars.df, strip_extension = FALSE)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -29335,604 +33041,604 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # set the number workers to 2</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' setup_disk.frame(2)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="identifier">get_chunk_ids</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">strip_extension</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">23</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # if you do not wish to use multiple workers you can set it to sequential</span></pre>
+                      <pre class="language-r">  <span class="identifier">lf</span> <span class="operator">=</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span><span class="paren">)</span>, <span class="identifier">full.names</span> <span class="operator">=</span> <span class="identifier">full.names</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">24</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">263<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' setup_disk.frame(future_backend=future::sequential)</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">full.names</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">25</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">204<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">setup_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="identifier">logical</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span>, <span class="identifier">future_backend</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">multiprocess</span>, <span class="keyword">...</span>, <span class="identifier">gui</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">lf</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">26</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">gui</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">27</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="coverage">59<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">plan</span><span class="paren">(</span><span class="identifier">future_backend</span>, <span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">workers</span>, <span class="identifier">gc</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">purrr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">map_chr</span><span class="paren">(</span><span class="identifier">lf</span>, <span class="operator">~</span><span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">28</td>
-                    <td class="coverage">6<em>x</em></td>
+                    <td class="coverage">305<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">message</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"The number of workers available for disk.frame is %d"</span>, <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="identifier">tmp</span> <span class="operator">=</span> <span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">str_split</span><span class="paren">(</span><span class="identifier">.x</span>,<span class="identifier">stringr</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fixed</span><span class="paren">(</span><span class="string">"."</span><span class="paren">)</span>, <span class="identifier">simplify</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">305<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># do not limit the amount of transfers to other workers</span></pre>
+                      <pre class="language-r">    <span class="identifier">l</span> <span class="operator">=</span> <span class="identifier">length</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">305<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment"># this is not allowed by CRAN policy</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">l</span> <span class="operator">==</span> <span class="number">1</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">31</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#options(future.globals.maxSize = future.globals.maxSize)</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">32</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">305<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="comment">#options(disk.frame.nworkers = workers)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">strip_extension</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">33</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">269<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="keyword">if</span><span class="paren">(</span><span class="identifier">gui</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">      <span class="identifier">paste0</span><span class="paren">(</span><span class="identifier">tmp</span><span class="paren">[</span><span class="operator">-</span><span class="identifier">l</span><span class="paren">]</span>, <span class="identifier">collapse</span><span class="operator">=</span><span class="string">""</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">34</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">if</span> <span class="paren">(</span><span class="operator">!</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"shiny"</span>, <span class="identifier">quietly</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="covered">
                     <td class="num">35</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage">36<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="keyword">stop</span><span class="paren">(</span><span class="string">"Package \"shiny\" must be installed to use GUI. You can install shiny using install.packages('shiny')"</span>,</pre>
+                      <pre class="language-r">      <span class="identifier">.x</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">36</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">           <span class="identifier">call</span>. <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">38</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">39</td>
-                    <td class="coverage">!</td>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/util.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">ui</span> <span class="operator">&lt;-</span> <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fluidPage</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' Helper function to evalparse some `glue::glue` string</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">40</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">2</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">h1</span><span class="paren">(</span><span class="string">"disk.frame settings"</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param code the code in character(string) format to evaluate</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">41</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">3</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">sliderInput</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param env the environment in which to evaluate the code</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">42</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">4</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="string">"nbrOfWorkers"</span>, </pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">43</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">5</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"Number of workers (recommendation = %d)"</span>, <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="identifier">logical</span> <span class="operator">=</span> <span class="literal">FALSE</span><span class="paren">)</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="identifier">evalparseglue</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">code</span>, <span class="identifier">env</span> <span class="operator">=</span> <span class="identifier">parent.frame</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">44</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">6</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="number">1</span>, </pre>
+                      <pre class="language-r">  <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="identifier">code</span>, <span class="identifier">.envir</span> <span class="operator">=</span> <span class="identifier">env</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">env</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">45</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">parallel</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">detectCores</span><span class="paren">(</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">46</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">value</span> <span class="operator">=</span> <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span>, </pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">47</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">9</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">step</span> <span class="operator">=</span> <span class="number">1</span><span class="paren">)</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' Generate synthetic dataset for testing</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">48</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">10</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">includeMarkdown</span><span class="paren">(</span><span class="identifier">system.file</span><span class="paren">(</span><span class="string">"options.rmd"</span>, <span class="identifier">package</span><span class="operator">=</span><span class="string">"disk.frame"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param N number of rows. Defaults to 200 million</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># , shiny::checkboxInput(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param K controls the number of unique values for id. Some ids will have K distinct values while others have N/K distinct values</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   "inf_fgm", </span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom stats runif</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   "Recommended: Set Maximum transfer size between workers to Inf (so ignore slider below)", </span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   value = ifelse(</span></pre>
+                      <pre class="language-r"><span class="identifier">gen_datatable_synthetic</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">=</span><span class="number">2e8</span>, <span class="identifier">K</span><span class="operator">=</span><span class="number">100</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">53</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">15</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#     is.null(getOption("future.globals.maxSize")), </span></pre>
+                      <pre class="language-r">  <span class="identifier">data.table</span><span class="paren">(</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">54</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">16</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#     TRUE, </span></pre>
+                      <pre class="language-r">    <span class="identifier">id1</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%03d"</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">K</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,      <span class="comment"># large groups (char)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">55</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">17</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#     is.infinite(getOption("future.globals.maxSize")))</span></pre>
+                      <pre class="language-r">    <span class="identifier">id2</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%03d"</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">K</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,      <span class="comment"># large groups (char)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">56</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">18</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># )</span></pre>
+                      <pre class="language-r">    <span class="identifier">id3</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%010d"</span>,<span class="number">1</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">/</span><span class="identifier">K</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>, <span class="comment"># small groups (char)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">57</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">19</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># ,shiny::sliderInput(</span></pre>
+                      <pre class="language-r">    <span class="identifier">id4</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># large groups (int)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">58</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">20</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   "future.globals.maxSize",</span></pre>
+                      <pre class="language-r">    <span class="identifier">id5</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># large groups (int)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">59</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">21</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   "Maximum transfer size between workers (gb)",</span></pre>
+                      <pre class="language-r">    <span class="identifier">id6</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">/</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                        <span class="comment"># small groups (int)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">60</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">22</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   0,</span></pre>
+                      <pre class="language-r">    <span class="identifier">v1</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="number">5</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># int in range [1,5]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">61</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">23</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   ifelse(is.infinite(memory.limit()), 3904, memory.limit()/1024/1024/1024),</span></pre>
+                      <pre class="language-r">    <span class="identifier">v2</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="number">5</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># int in range [1,5]</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">62</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">24</td>
+                    <td class="coverage">15<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">v3</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">round</span><span class="paren">(</span><span class="identifier">runif</span><span class="paren">(</span><span class="number">100</span>,<span class="identifier">max</span><span class="operator">=</span><span class="number">100</span><span class="paren">)</span>,<span class="number">4</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>, <span class="comment"># numeric e.g. 23.5749</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">25</td>
+                    <td class="coverage">15<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   value = ifelse(is.infinite(getOption("future.globals.maxSize")), 3904, memory.limit()/1024/1024/1024),</span></pre>
+                      <pre class="language-r">    <span class="identifier">date1</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">seq</span><span class="paren">(</span><span class="identifier">as.Date</span><span class="paren">(</span><span class="string">'1970-01-01'</span><span class="paren">)</span>, <span class="identifier">as.Date</span><span class="paren">(</span><span class="string">'2019-01-01'</span><span class="paren">)</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"day"</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>  <span class="comment"># date</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">63</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#   step = 0.5</span></pre>
+                      <pre class="language-r">  <span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">64</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment"># )</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/names.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">65</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' Return the column names of the disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">66</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">67</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">server</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">input</span>, <span class="identifier">output</span>, <span class="identifier">session</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">68</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">      <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">observe</span><span class="paren">(</span><span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">69</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">        <span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">plan</span><span class="paren">(</span><span class="identifier">future_backend</span>, <span class="identifier">workers</span> <span class="operator">=</span> <span class="identifier">input</span><span class="operator">$</span><span class="identifier">nbrOfWorkers</span>, <span class="identifier">gc</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">70</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="paren">}</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' The returned column names are from the source. So if you have lazy operations then the </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">71</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      </pre>
+                      <pre class="language-r"><span class="comment">#' colnames here does not reflects the results of those operations. To obtain the correct names try</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">72</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#shiny::observe({</span></pre>
+                      <pre class="language-r"><span class="comment">#' \code{names(collect(get_chunk(df, 1)))}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">73</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#if(input$inf_fgm) {</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">74</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="comment">#options(future.globals.maxSize = Inf)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">75</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#} else {</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">76</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">          <span class="comment">#options(future.globals.maxSize = input$future.globals.maxSize*1024*1024*1024)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">77</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">        <span class="comment">#}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_ls</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">78</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">      <span class="comment">#})</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fst metadata_fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">79</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">80</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    </pre>
+                      <pre class="language-r"><span class="identifier">colnames</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">81</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">14</td>
+                    <td class="coverage">47<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">shiny</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">shinyApp</span><span class="paren">(</span><span class="identifier">ui</span>, <span class="identifier">server</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"colnames"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">82</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">83</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">16</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"setup_disk.frame: gui must be set to either TRUE or FALSE"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">84</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">85</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/sample_n.R" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">sample_n.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">size</span> <span class="operator">=</span> <span class="number">1</span>, <span class="identifier">replace</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="identifier">weight</span> <span class="operator">=</span> <span class="literal">NULL</span>, <span class="identifier">.env</span> <span class="operator">=</span> <span class="literal">NULL</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">names.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">2</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">20</td>
+                    <td class="coverage">2<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">stop</span><span class="paren">(</span><span class="string">"not implemented yet"</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">colnames.disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">3</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">21</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">weight</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">4</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">22</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"sample_n(..., weight =) is not implemented yet"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#delayed(df, ~sample_frac(.x, size, replace, weight, .env))</span></pre>
+                      <pre class="language-r"><span class="identifier">colnames.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">8</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">26</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">res</span> <span class="operator">=</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>, <span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span> <span class="operator">%&gt;%</span> </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">9</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">27</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r">    <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_ls</span><span class="paren">(</span><span class="identifier">type</span><span class="operator">=</span><span class="string">"file"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/tbl_vars.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">28</td>
+                    <td class="coverage">21<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Column names for RStudio auto-complete</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">29</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">return</span><span class="paren">(</span><span class="identifier">vector</span><span class="paren">(</span><span class="string">"character"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">30</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @description </span></pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">31</td>
+                    <td class="coverage">21<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">metadata_fst</span><span class="paren">(</span><span class="identifier">res</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">columnNames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">32</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Returns the names of the columns. Needed for RStudio to complete variable</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">33</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' names</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">34</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom dplyr tbl_vars</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname colnames</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">36</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">37</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">tbl_vars.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">colnames.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
-                    <td class="num">9</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="num">38</td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">names.disk.frame</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -29941,436 +33647,466 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/as.data.frame.r" class="hidden">
+            <div id="R/ncol-nrow.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Convert disk.frame to data.frame by collecting all chunks</span></pre>
+                      <pre class="language-r"><span class="comment">#' Number of rows or columns</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to base::nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param row.names NULL or a character vector giving the row names for the data frame. Missing values are not allowed.</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param optional logical. If TRUE, setting row names and converting column names (to syntactic names: see make.names) is optional. Note that all of R's base package as.data.frame() methods use optional only for column names treatment, basically with the meaning of data.frame(*, check.names = !optional). See also the make.names argument of the matrix method.</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... additional arguments to be passed to or from methods.</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # return total number of column and rows</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' as.data.frame(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' ncol(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' nrow(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">as.data.frame.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">row.names</span>, <span class="identifier">optional</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># needs to retain x for consistency</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">as.data.frame</span><span class="paren">(</span><span class="identifier">collect</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">row.names</span>, <span class="identifier">optional</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">nrow</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>,<span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">15</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">361<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"nrow"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Convert disk.frame to data.table by collecting all chunks</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param keep.rownames passed to as.data.table</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param ... passed to as.data.table</span></pre>
+                      <pre class="language-r"><span class="comment">#' @noRd</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="identifier">nrow.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">333<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
+                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nrow</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' library(data.table)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' as.data.table(cars.df)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="identifier">nrow.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">29</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">as.data.table.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">keep.rownames</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="identifier">is_ready</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">30</td>
-                    <td class="coverage">1<em>x</em></td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">as.data.table</span><span class="paren">(</span><span class="identifier">collect</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">keep.rownames</span> <span class="operator">=</span> <span class="identifier">keep.rownames</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">path1</span> <span class="operator">&lt;-</span> <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"path"</span>, <span class="identifier">exact</span><span class="operator">=</span><span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="covered">
                     <td class="num">31</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">dir.exists</span><span class="paren">(</span><span class="identifier">path1</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/delete.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
-                  <tr class="never">
-                    <td class="num">1</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">32</td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Delete a disk.frame</span></pre>
+                      <pre class="language-r">    <span class="identifier">path2</span> <span class="operator">&lt;-</span> <span class="identifier">list.files</span><span class="paren">(</span><span class="identifier">path1</span>,<span class="identifier">full.names</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">2</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">33</td>
+                    <td class="coverage">28<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="identifier">length</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">)</span> <span class="operator">==</span> <span class="number">0</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">3</td>
-                    <td class="coverage"></td>
+                  <tr class="missed">
+                    <td class="num">34</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_delete</span></pre>
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="number">0</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">35</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">36</td>
+                    <td class="coverage">28<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="identifier">tmpfstmeta</span> <span class="operator">=</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">path2</span><span class="paren">[</span><span class="number">1</span><span class="paren">]</span><span class="paren">)</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">37</td>
+                    <td class="coverage">28<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">    <span class="keyword">if</span><span class="paren">(</span><span class="string">"nrOfRows"</span> <span class="operator">%in%</span> <span class="identifier">names</span><span class="paren">(</span><span class="identifier">tmpfstmeta</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">38</td>
+                    <td class="coverage">28<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">path2</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">nrOfRows</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">39</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="missed">
+                    <td class="num">40</td>
+                    <td class="coverage">!</td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">      <span class="keyword">return</span><span class="paren">(</span><span class="identifier">sum</span><span class="paren">(</span><span class="identifier">sapply</span><span class="paren">(</span><span class="identifier">path2</span>, <span class="keyword">function</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span> <span class="identifier">fst</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">fst.metadata</span><span class="paren">(</span><span class="identifier">p2</span><span class="paren">)</span><span class="operator">$</span><span class="identifier">NrOfRows</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">41</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r">    <span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">42</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">43</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">delete</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r">    <span class="comment">#return(fst::fst.metadata(path1)$NrOfRows)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">9</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="missed">
+                    <td class="num">44</td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"nrow error: directory {} does not exist"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">45</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r">  <span class="paren">}</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">11</td>
-                    <td class="coverage">8<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">46</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">47</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                </tbody>
-              </table>
-            </div>
-            <div id="R/srckeep.disk.frame.r" class="hidden">
-              <table class="table-condensed">
-                <tbody>
                   <tr class="never">
-                    <td class="num">1</td>
+                    <td class="num">48</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Keep only the variables from the input listed in selections</span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fst</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">2</td>
+                    <td class="num">49</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">3</td>
+                    <td class="num">50</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param selections The list of variables to keep from the input source</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">4</td>
+                    <td class="num">51</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="identifier">ncol</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">52</td>
+                    <td class="coverage">142<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">UseMethod</span><span class="paren">(</span><span class="string">"ncol"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">5</td>
+                    <td class="num">53</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">6</td>
+                    <td class="num">54</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">55</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @import fs</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">56</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # when loading cars's chunks into RAM, load only the column speed</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">57</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' collect(srckeep(cars.df, "speed"))</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">58</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' </span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname ncol_nrow</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">59</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' # clean up cars.df</span></pre>
+                      <pre class="language-r"><span class="identifier">ncol.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">60</td>
+                    <td class="coverage">12<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">length</span><span class="paren">(</span><span class="identifier">colnames</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">61</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">13</td>
+                    <td class="num">62</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">srckeep</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span>, <span class="identifier">selections</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">14</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">63</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">15</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="never">
+                    <td class="num">64</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>,<span class="string">"keep"</span><span class="paren">)</span> <span class="operator">=</span> <span class="identifier">selections</span></pre>
+                      <pre class="language-r"><span class="identifier">ncol.default</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
-                    <td class="num">16</td>
-                    <td class="coverage">1<em>x</em></td>
+                  <tr class="covered">
+                    <td class="num">65</td>
+                    <td class="coverage">130<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">df</span></pre>
+                      <pre class="language-r">  <span class="identifier">base</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">ncol</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">17</td>
+                    <td class="num">66</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -30379,612 +34115,611 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/zzz.r" class="hidden">
+            <div id="R/collect.summarized_disk.frame.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">.onLoad</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">libname</span>, <span class="identifier">pkgname</span><span class="paren">)</span><span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into R</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' Bring the disk.frame into RAM by loading the data and running all lazy</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' operations as data.table/data.frame or as a list</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom future nbrOfWorkers</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom crayon red blue green</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param parallel if TRUE the collection is performed in parallel. By default</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">.onAttach</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">libname</span>, <span class="identifier">pkgname</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#'   if there are delayed/lazy steps then it will be parallel, otherwise it will</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="comment">#setup_disk.frame()</span></pre>
+                      <pre class="language-r"><span class="comment">#'   not be in parallel. This is because parallel requires transferring data</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  </pre>
+                      <pre class="language-r"><span class="comment">#'   from background R session to the current R session and if there is no</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">10</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">packageStartupMessage</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#'   computation then it's better to avoid transferring data between session,</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">11</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">crayon</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">red</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#'   hence parallel = FALSE is a better choice</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">12</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... not used</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">13</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    "\n\n## Message from disk.frame:</pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom data.table data.table as.data.table</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">14</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">We</span> <span class="identifier">have</span> <span class="paren">{</span><span class="identifier">future</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">nbrOfWorkers</span><span class="paren">(</span><span class="paren">)</span><span class="paren">}</span> <span class="identifier">workers</span> <span class="identifier">to</span> <span class="identifier">use</span> <span class="identifier">with</span> <span class="identifier">disk.frame</span>.</pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom furrr future_map_dfr future_options</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">15</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">To change that, use setup_disk.frame(workers = n) or just setup_disk.frame() to use the defaults.")),</pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom purrr map_dfr</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    crayon::green("\n\n</pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr collect select mutate</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">17</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">It</span> <span class="identifier">is</span> <span class="identifier">recommended</span> <span class="identifier">that</span> <span class="identifier">you</span> <span class="identifier">run</span> <span class="identifier">the</span> <span class="identifier">following</span> <span class="identifier">immediately</span> <span class="identifier">to</span> <span class="identifier">set</span> <span class="identifier">up</span> <span class="identifier">disk.frame</span> <span class="identifier">with</span> <span class="identifier">multiple</span> <span class="identifier">workers</span> <span class="keyword">in</span> <span class="identifier">order</span> <span class="identifier">to</span> <span class="identifier">parallelize</span> <span class="identifier">your</span> <span class="identifier">operations</span><span class="operator">:</span>\<span class="identifier">n</span>\<span class="identifier">n</span></pre>
+                      <pre class="language-r"><span class="comment">#' @return collect return a data.frame/data.table</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">18</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">```r</pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># this will set up disk.frame with multiple workers</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">20</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">setup_disk.frame</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # use collect to bring the data into RAM as a data.table/data.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># this will allow unlimited amount of data to be passed from worker to worker</span></pre>
+                      <pre class="language-r"><span class="comment">#' collect(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">22</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">options</span><span class="paren">(</span><span class="identifier">future.globals.maxSize</span> <span class="operator">=</span> <span class="literal">Inf</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#'</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">```</pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">24</td>
-                    <td class="coverage">12<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">\n\n"))</pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname collect</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">globalVariables</span><span class="paren">(</span><span class="identifier">c</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="identifier">collect.summarized_disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="keyword">...</span>, <span class="identifier">parallel</span> <span class="operator">=</span> <span class="operator">!</span><span class="identifier">is.null</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">x</span>,<span class="string">"lazyfn"</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">28</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"syms"</span>, <span class="comment"># needed by dplyr to treat something as a symbol</span></pre>
+                      <pre class="language-r">  <span class="identifier">code_to_run</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="string">"x %&gt;% {attr(x, 'summarize_code') %&gt;% as.character}"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">29</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"."</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">class</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="operator">&lt;-</span> <span class="string">"disk.frame"</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">30</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">".BY"</span>,</pre>
+                      <pre class="language-r">  <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">code_to_run</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">".N"</span>,</pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
+                    </td>
+                  </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/as.data.frame.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
+                  <tr class="never">
+                    <td class="num">1</td>
+                    <td class="coverage"></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r"><span class="comment">#' Convert disk.frame to data.frame by collecting all chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">32</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">".SD"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">33</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">".out.disk.frame.id"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param row.names NULL or a character vector giving the row names for the data frame. Missing values are not allowed.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">34</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">":="</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param optional logical. If TRUE, setting row names and converting column names (to syntactic names: see make.names) is optional. Note that all of R's base package as.data.frame() methods use optional only for column names treatment, basically with the meaning of data.frame(*, check.names = !optional). See also the make.names argument of the matrix method.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">35</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"N"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param ... additional arguments to be passed to or from methods.</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">36</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"area"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">37</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"chunk_id"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">38</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"coltypes"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">39</td>
+                    <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"coltypes.x"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' as.data.frame(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">40</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"coltypes.y"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">41</td>
+                    <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"ctot"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">42</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"existing_df"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">43</td>
+                    <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"feature_s"</span>,</pre>
+                      <pre class="language-r"><span class="identifier">as.data.frame.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">row.names</span>, <span class="identifier">optional</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span> <span class="comment"># needs to retain x for consistency</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">14</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">as.data.frame</span><span class="paren">(</span><span class="identifier">collect</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">row.names</span>, <span class="identifier">optional</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">44</td>
+                    <td class="num">15</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"h"</span>,</pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">45</td>
+                    <td class="num">16</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"height"</span>,</pre>
+                      <pre class="language-r"></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">46</td>
+                    <td class="num">17</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"incompatible_types"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' Convert disk.frame to data.table by collecting all chunks</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">47</td>
+                    <td class="num">18</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"lag_height"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">48</td>
+                    <td class="num">19</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"new_chunk"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param keep.rownames passed to as.data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">49</td>
+                    <td class="num">20</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"ok"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @param ... passed to as.data.table</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">50</td>
+                    <td class="num">21</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"pathA"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">51</td>
+                    <td class="num">22</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"pathB"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' @examples </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">52</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"w"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' library(data.table)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">53</td>
+                    <td class="num">24</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"xid"</span>,</pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">54</td>
+                    <td class="num">25</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">                  <span class="string">"yid"</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' as.data.table(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">55</td>
+                    <td class="num">26</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">56</td>
+                    <td class="num">27</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @useDynLib disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">57</td>
+                    <td class="num">28</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom Rcpp evalCpp</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">58</td>
+                    <td class="num">29</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#@exportPattern "^[[:alpha:]]+"</span></pre>
+                      <pre class="language-r"><span class="identifier">as.data.table.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">keep.rownames</span> <span class="operator">=</span> <span class="literal">FALSE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                    </td>
+                  </tr>
+                  <tr class="covered">
+                    <td class="num">30</td>
+                    <td class="coverage">1<em>x</em></td>
+                    <td class="col-sm-12">
+                      <pre class="language-r">  <span class="identifier">as.data.table</span><span class="paren">(</span><span class="identifier">collect</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span>, <span class="identifier">keep.rownames</span> <span class="operator">=</span> <span class="identifier">keep.rownames</span>, <span class="keyword">...</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">59</td>
+                    <td class="num">31</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="literal">NULL</span></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
                 </tbody>
               </table>
             </div>
-            <div id="R/util.r" class="hidden">
+            <div id="R/compute.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Helper function to evalparse some `glue::glue` string</span></pre>
+                      <pre class="language-r"><span class="comment">#' Compute without writing</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param code the code in character(string) format to evaluate</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param env the environment in which to evaluate the code</span></pre>
+                      <pre class="language-r"><span class="comment">#' Perform the computation; same as calling cmap without .f and lazy = FALSE</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">evalparseglue</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">code</span>, <span class="identifier">env</span> <span class="operator">=</span> <span class="identifier">parent.frame</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param outdir the output directory</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
+                  <tr class="never">
                     <td class="num">6</td>
-                    <td class="coverage">!</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">eval</span><span class="paren">(</span><span class="identifier">parse</span><span class="paren">(</span><span class="identifier">text</span> <span class="operator">=</span> <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="identifier">code</span>, <span class="identifier">.envir</span> <span class="operator">=</span> <span class="identifier">env</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">envir</span> <span class="operator">=</span> <span class="identifier">env</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param overwrite whether to overwrite or not</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param name Not used. Kept for compatibility with dplyr</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' @param ... Not used. Kept for dplyr compatibility</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">9</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Generate synthetic dataset for testing</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param N number of rows. Defaults to 200 million</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr compute</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">11</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @param K controls the number of unique values for id. Some ids will have K distinct values while others have N/K distinct values</span></pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @importFrom stats runif</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">13</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df2 = cars.df %&gt;% cmap(~.x)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">14</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">gen_datatable_synthetic</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">=</span><span class="number">2e8</span>, <span class="identifier">K</span><span class="operator">=</span><span class="number">100</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' # the computation is performed and the data is now stored elsewhere</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">15</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">data.table</span><span class="paren">(</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df3 = compute(cars.df2)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">16</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id1</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%03d"</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">K</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,      <span class="comment"># large groups (char)</span></pre>
+                      <pre class="language-r"><span class="comment">#' </span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">17</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id2</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%03d"</span>,<span class="number">1</span><span class="operator">:</span><span class="identifier">K</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,      <span class="comment"># large groups (char)</span></pre>
+                      <pre class="language-r"><span class="comment">#' # clean up</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">18</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id3</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">sprintf</span><span class="paren">(</span><span class="string">"id%010d"</span>,<span class="number">1</span><span class="operator">:</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">/</span><span class="identifier">K</span><span class="paren">)</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>, <span class="comment"># small groups (char)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">19</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id4</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># large groups (int)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df3)</span></pre>
                     </td>
                   </tr>
-                  <tr class="covered">
+                  <tr class="never">
                     <td class="num">20</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id5</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># large groups (int)</span></pre>
+                      <pre class="language-r"><span class="identifier">compute.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">name</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">tempfile</span><span class="paren">(</span><span class="string">"tmp_df_"</span>, <span class="identifier">fileext</span><span class="operator">=</span><span class="string">".df"</span><span class="paren">)</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span>, <span class="keyword">...</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">21</td>
-                    <td class="coverage">19<em>x</em></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">id6</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">N</span><span class="operator">/</span><span class="identifier">K</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                        <span class="comment"># small groups (int)</span></pre>
+                      <pre class="language-r">  <span class="identifier">overwrite_check</span><span class="paren">(</span><span class="identifier">outdir</span>, <span class="identifier">overwrite</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="covered">
                     <td class="num">22</td>
-                    <td class="coverage">19<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">v1</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="number">5</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># int in range [1,5]</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">23</td>
-                    <td class="coverage">19<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">v2</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="number">5</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>,                          <span class="comment"># int in range [1,5]</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">24</td>
-                    <td class="coverage">19<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">v3</span> <span class="operator">=</span>  <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">round</span><span class="paren">(</span><span class="identifier">runif</span><span class="paren">(</span><span class="number">100</span>,<span class="identifier">max</span><span class="operator">=</span><span class="number">100</span><span class="paren">)</span>,<span class="number">4</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>, <span class="comment"># numeric e.g. 23.5749</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="covered">
-                    <td class="num">25</td>
-                    <td class="coverage">19<em>x</em></td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">date1</span> <span class="operator">=</span> <span class="identifier">sample</span><span class="paren">(</span><span class="identifier">seq</span><span class="paren">(</span><span class="identifier">as.Date</span><span class="paren">(</span><span class="string">'1970-01-01'</span><span class="paren">)</span>, <span class="identifier">as.Date</span><span class="paren">(</span><span class="string">'2019-01-01'</span><span class="paren">)</span>, <span class="identifier">by</span> <span class="operator">=</span> <span class="string">"day"</span><span class="paren">)</span>, <span class="identifier">N</span>, <span class="literal">TRUE</span><span class="paren">)</span>  <span class="comment"># date</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="never">
-                    <td class="num">26</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">3<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">write_disk.frame</span><span class="paren">(</span><span class="identifier">x</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span>, <span class="identifier">overwrite</span> <span class="operator">=</span> <span class="literal">TRUE</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">27</td>
+                    <td class="num">23</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -30993,14 +34728,14 @@ <h2>disk.frame coverage - 51.96%</h2>
                 </tbody>
               </table>
             </div>
-            <div id="R/show_ceremony.R" class="hidden">
+            <div id="R/map_by_chunk_id.r" class="hidden">
               <table class="table-condensed">
                 <tbody>
                   <tr class="never">
                     <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' Show the code to setup disk.frame</span></pre>
+                      <pre class="language-r"><span class="comment">#' @rdname cmap2</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
@@ -31014,200 +34749,191 @@ <h2>disk.frame coverage - 51.96%</h2>
                     <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">show_ceremony</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="identifier">map_by_chunk_id</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
                   <tr class="missed">
                     <td class="num">4</td>
                     <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="identifier">glue</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">glue</span><span class="paren">(</span><span class="identifier">crayon</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">green</span><span class="paren">(</span><span class="identifier">ceremony_text</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="keyword">warning</span><span class="paren">(</span><span class="string">"map_by_chunk_id is deprecated. Use map2 instead"</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
+                  <tr class="missed">
                     <td class="num">5</td>
-                    <td class="coverage"></td>
+                    <td class="coverage">!</td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">map2.disk.frame</span><span class="paren">(</span><span class="identifier">.x</span>, <span class="identifier">.y</span>, <span class="identifier">.f</span>, <span class="keyword">...</span>, <span class="identifier">outdir</span> <span class="operator">=</span> <span class="identifier">outdir</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
                     <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/delete.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">7</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Delete a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">8</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param df a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">9</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom fs dir_delete</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">10</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">ceremony_text</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">11</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">"</pre>
+                      <pre class="language-r"><span class="comment">#' @examples</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">12</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># this willl set disk.frame with multiple workers</span></pre>
+                      <pre class="language-r"><span class="comment">#' cars.df = as.disk.frame(cars)</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">13</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">7</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">setup_disk.frame</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' delete(cars.df)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">14</td>
+                    <td class="num">8</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment"># this will allow unlimited amount of data to be passed from worker to worker</span></pre>
+                      <pre class="language-r"><span class="identifier">delete</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">15</td>
-                    <td class="coverage">!</td>
+                  <tr class="covered">
+                    <td class="num">9</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">options</span><span class="paren">(</span><span class="identifier">future.globals.maxSize</span> <span class="operator">=</span> <span class="literal">Inf</span><span class="paren">)</span></pre>
+                      <pre class="language-r">  <span class="identifier">stopifnot</span><span class="paren">(</span><span class="string">"disk.frame"</span> <span class="operator">%in%</span> <span class="identifier">class</span><span class="paren">(</span><span class="identifier">df</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">16</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">"</pre>
+                      <pre class="language-r">  </pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">17</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">11</td>
+                    <td class="coverage">8<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">fs</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">dir_delete</span><span class="paren">(</span><span class="identifier">attr</span><span class="paren">(</span><span class="identifier">df</span>, <span class="string">"path"</span><span class="paren">)</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">18</td>
+                    <td class="num">12</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="paren">}</span></pre>
                     </td>
                   </tr>
+                </tbody>
+              </table>
+            </div>
+            <div id="R/tbl_vars.r" class="hidden">
+              <table class="table-condensed">
+                <tbody>
                   <tr class="never">
-                    <td class="num">19</td>
+                    <td class="num">1</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
+                      <pre class="language-r"><span class="comment">#' Column names for RStudio auto-complete</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">20</td>
+                    <td class="num">2</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">21</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">show_boilerplate</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="identifier">show_ceremony</span><span class="paren">(</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @description </span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">22</td>
+                    <td class="num">3</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"></pre>
+                      <pre class="language-r"><span class="comment">#' Returns the names of the columns. Needed for RStudio to complete variable</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">23</td>
+                    <td class="num">4</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @rdname show_ceremony</span></pre>
+                      <pre class="language-r"><span class="comment">#' names</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">24</td>
+                    <td class="num">5</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="comment">#' @export</span></pre>
+                      <pre class="language-r"><span class="comment">#' @param x a disk.frame</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">25</td>
+                    <td class="num">6</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r"><span class="identifier">insert_ceremony</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">26</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">  <span class="keyword">if</span><span class="paren">(</span><span class="identifier">requireNamespace</span><span class="paren">(</span><span class="string">"rstudioapi"</span><span class="paren">)</span><span class="paren">)</span> <span class="paren">{</span></pre>
-                    </td>
-                  </tr>
-                  <tr class="missed">
-                    <td class="num">27</td>
-                    <td class="coverage">!</td>
-                    <td class="col-sm-12">
-                      <pre class="language-r">    <span class="identifier">rstudioapi</span><span class="operator">:</span><span class="operator">:</span><span class="identifier">insertText</span><span class="paren">(</span><span class="identifier">ceremony_text</span><span class="paren">(</span><span class="paren">)</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="comment">#' @importFrom dplyr tbl_vars</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">28</td>
+                    <td class="num">7</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span> <span class="keyword">else</span> <span class="paren">{</span></pre>
+                      <pre class="language-r"><span class="comment">#' @export</span></pre>
                     </td>
                   </tr>
-                  <tr class="missed">
-                    <td class="num">29</td>
-                    <td class="coverage">!</td>
+                  <tr class="never">
+                    <td class="num">8</td>
+                    <td class="coverage"></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">    <span class="keyword">stop</span><span class="paren">(</span><span class="string">"insert ceremony can only be used inside RStudio"</span><span class="paren">)</span></pre>
+                      <pre class="language-r"><span class="identifier">tbl_vars.disk.frame</span> <span class="operator">&lt;-</span> <span class="keyword">function</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span> <span class="paren">{</span></pre>
                     </td>
                   </tr>
-                  <tr class="never">
-                    <td class="num">30</td>
-                    <td class="coverage"></td>
+                  <tr class="covered">
+                    <td class="num">9</td>
+                    <td class="coverage">1<em>x</em></td>
                     <td class="col-sm-12">
-                      <pre class="language-r">  <span class="paren">}</span></pre>
+                      <pre class="language-r">  <span class="identifier">names.disk.frame</span><span class="paren">(</span><span class="identifier">x</span><span class="paren">)</span></pre>
                     </td>
                   </tr>
                   <tr class="never">
-                    <td class="num">31</td>
+                    <td class="num">10</td>
                     <td class="coverage"></td>
                     <td class="col-sm-12">
                       <pre class="language-r"><span class="paren">}</span></pre>
@@ -31227,4 +34953,4 @@ <h2>disk.frame coverage - 51.96%</h2>
 </div>
 
 
-<div id="feedly-mini" title="feedly Mini tookit"></div><span id="buffer-extension-hover-button" style="display: none; position: absolute; z-index: 8675309; width: 100px; height: 25px; background-image: url(&quot;chrome-extension://noojglkidnpfjbincgijbaiedldjfbhh/data/shared/img/buffer-hover-icon@2x.png&quot;); background-size: 100px 25px; opacity: 0.9; cursor: pointer;"></span></body></html>
\ No newline at end of file
+<span id="buffer-extension-hover-button" style="display: none; position: absolute; z-index: 8675309; width: 100px; height: 25px; background-image: url(&quot;chrome-extension://noojglkidnpfjbincgijbaiedldjfbhh/data/shared/img/buffer-hover-icon@2x.png&quot;); background-size: 100px 25px; opacity: 0.9; cursor: pointer;"></span></body></html>
\ No newline at end of file
diff --git a/misc/disk.frame-report_files/datatables-crosstalk.css b/misc/disk.frame-report_files/datatables-crosstalk.css
index 43422d25..fb5bae84 100644
--- a/misc/disk.frame-report_files/datatables-crosstalk.css
+++ b/misc/disk.frame-report_files/datatables-crosstalk.css
@@ -5,3 +5,19 @@
 html body div.DTS div.dataTables_scrollBody {
   background: none;
 }
+
+
+/*
+Fix https://github.com/rstudio/DT/issues/563
+If the `table.display` is set to "block" (e.g., pkgdown), the browser will display
+datatable objects strangely. The search panel and the page buttons will still be
+in full-width but the table body will be "compact" and shorter.
+In therory, having this attributes will affect `dom="t"`
+with `display: block` users. But in reality, there should be no one.
+We may remove the below lines in the future if the upstream agree to have this there.
+See https://github.com/DataTables/DataTablesSrc/issues/160
+*/
+
+table.dataTable {
+  display: table;
+}

From 4056ce2b7f27da58e2933fd6d0cf41b709eabf4b Mon Sep 17 00:00:00 2001
From: xiaodaigh <zhuojia.dai@gmail.com>
Date: Tue, 11 Aug 2020 01:48:57 +1000
Subject: [PATCH 2/9] getting there on better nse wholesale

---
 NAMESPACE                            |  2 +-
 R/chunk_mapper.r                     | 15 ++----
 R/cmap.r                             | 75 +++++-----------------------
 R/collect.r                          | 61 ++++++++++------------
 R/collect.summarized_disk.frame.r    |  2 +-
 R/compute.r                          | 17 ++++---
 R/disk.frame.r                       |  4 +-
 R/names.r                            |  4 +-
 R/one-stage-verbs.R                  | 32 ++++++++----
 R/util.r                             | 22 +++++++-
 R/write_disk.frame.r                 | 46 +++++++++++------
 R/zip_to_disk.frame.r                | 36 +++++--------
 man/cmap.Rd                          | 31 ++----------
 man/collect.Rd                       | 15 ++++--
 man/compute.disk.frame.Rd            | 16 ++----
 man/group_by.Rd                      |  4 +-
 man/write_disk.frame.Rd              |  8 +--
 tests/testthat/test-compute.r        | 44 ++++++++--------
 tests/testthat/test-csv2disk.frame.r | 12 ++++-
 19 files changed, 202 insertions(+), 244 deletions(-)

diff --git a/NAMESPACE b/NAMESPACE
index 77e4b782..4ee632d3 100644
--- a/NAMESPACE
+++ b/NAMESPACE
@@ -66,12 +66,12 @@ export(ceremony_text)
 export(chunk_arrange)
 export(chunk_distinct)
 export(chunk_group_by)
-export(chunk_lapply)
 export(chunk_summarise)
 export(chunk_summarize)
 export(chunk_ungroup)
 export(cimap)
 export(cimap_dfr)
+export(clapply)
 export(cmap)
 export(cmap2)
 export(cmap_dfr)
diff --git a/R/chunk_mapper.r b/R/chunk_mapper.r
index 9f4ea4f8..fd344de7 100644
--- a/R/chunk_mapper.r
+++ b/R/chunk_mapper.r
@@ -43,18 +43,13 @@ create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FA
       print(warning_msg)
     }
     
-    
     # you need to use list otherwise the names will be gone
-    sub_dotdotdot = substitute(list(...))
-    
-    code = paste0(deparse(sub_dotdotdot), collapse = "")
-    # code will be in the form of "list(...)"
-    code = substr(code, 6, nchar(code)-1)
+    code = substitute(chunk_fn(...))
     
-    if (code == "NULL") {
-      globals_and_pkgs = future::getGlobalsAndPackages(str2lang("chunk_fn()"))
+    if (deparse(code) == "chunk_fn(NULL)") {
+      globals_and_pkgs = future::getGlobalsAndPackages(expression(chunk_fn()))
     } else {
-      globals_and_pkgs = future::getGlobalsAndPackages(str2lang(sprintf("chunk_fn(%s)", code)))
+      globals_and_pkgs = future::getGlobalsAndPackages(code)
     }
     
     
@@ -67,7 +62,7 @@ create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FA
     # keep adding global variables
     
     while(!done) {
-      tmp_globals_and_pkgs = future::getGlobalsAndPackages(sub_dotdotdot, envir = env)
+      tmp_globals_and_pkgs = future::getGlobalsAndPackages(code, envir = env)
       new_global_vars = tmp_globals_and_pkgs$globals
       for (name in setdiff(names(new_global_vars), names(global_vars))) {
         global_vars[name] = new_global_vars[[name]]
diff --git a/R/cmap.r b/R/cmap.r
index fe04516f..e608d244 100644
--- a/R/cmap.r
+++ b/R/cmap.r
@@ -2,20 +2,11 @@
 #' @param .x a disk.frame
 #' @param .f a function to apply to each of the chunks
 #' @param outdir the output directory
-#' @param keep the columns to keep from the input
-#' @param chunks The number of chunks to output
 #' @param lazy if TRUE then do this lazily
-#' @param compress 0-100 fst compression ratio
-#' @param overwrite if TRUE removes any existing chunks in the data
 #' @param use.names for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
 #' @param fill for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
 #' @param idcol for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
-#' @param vars_and_pkgs variables and packages to send to a background session. This is typically automatically detected
-#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}
-#' @param ... for compatibility with `purrr::map`
-#' @import fst
-#' @importFrom purrr as_mapper map
-#' @importFrom future.apply future_lapply
+#' @param ... Passed to `collect` and `write_disk.frame`
 #' @export
 #' @examples
 #' cars.df = as.disk.frame(cars)
@@ -54,60 +45,19 @@ cmap <- function(.x, .f, ...) {
 #' @importFrom future getGlobalsAndPackages
 #' @export
 cmap.disk.frame <- function(.x, .f, ..., outdir = NULL, 
-                            keep = NULL, 
-                            chunks = nchunks(.x), 
-                            compress = 50, 
                             lazy = TRUE, 
-                            overwrite = FALSE, 
-                            .progress = TRUE) {
-  if(typeof(.f) == "language") {
-    if(requireNamespace("purrr")) {
-      .f = purrr::as_mapper(.f)
-    } else {
-      code = paste0(deparse(substitute(.f)), collapse = "")
-      stop(
-        sprintf(
-          "in cmap(.x, %s), it appears you are using {purrr} syntax but do not have {purrr} installed. Try `install.packages('purrr')`",
-          code
-        )
-      )
-    }
-  }
+                            overwrite = FALSE) {
+  ..f = create_chunk_mapper(purrr_as_mapper(.f))
   
   if (lazy) {
-    ..f = create_chunk_mapper(.f)
+    if (!is.null(outdir)) {
+      stop("In `cmap()`, `lazy` is `TRUE` but `outdir` is not `NULL`. This is not allowed.")
+    }
     return(..f(.x))
+  } else if(is.null(outdir)) {
+    return(collect_list(..f(.x), ...))
   } else {
-    # not lazy
-    if (is.null(outdir)) {
-      stop("cmap(...) error -- `lazy` = FALSE but `outdir` is not specified") 
-    }
-    
-    overwrite_check(outdir, overwrite)
-    
-    path <- attr(.x, "path")
-    files <- list.files(path, full.names = TRUE)
-    files_shortname <- list.files(path)
-    
-    cids = get_chunk_ids(.x, full.names = T, strip_extension = F)
-    
-    # compute
-    # TODO refactor that into a write_disk.frame()
-    future.apply::future_lapply(1:length(files), function(ii, ...) {
-      ds = get_chunk(.x, cids[ii], full.names = TRUE)
-      
-      res = .f(ds, ...)
-      
-      if(nrow(res) == 0) {
-        warning(sprintf("The output chunk has 0 row, therefore chunk %d NOT written", ii))
-      } else {
-        out_chunk_name = file.path(outdir, files_shortname[ii])
-        fst::write_fst(res, out_chunk_name, compress)
-      }
-      NULL
-    }, ...)
-    
-    return(disk.frame(outdir))
+    return(write_disk.frame(outdir, ..f(.x), ...))
   }
 }
 
@@ -140,12 +90,12 @@ cimap <- function(.x, .f, ...) {
 #' @export
 #' @rdname cmap
 cimap.disk.frame <- function(.x, .f, outdir = NULL, keep = NULL, chunks = nchunks(.x), compress = 50, lazy = TRUE, overwrite = FALSE, ...) {
-  .f = purrr::as_mapper(.f)
+  .f = purrr_as_mapper(.f)
   
   # TODO support lazy for cimap
   if(lazy) {
     stop("cimap.disk.frame: lazy = TRUE is not supported at this stage")
-    attr(.x, "lazyfn") = c(attr(.x, "lazyfn"), .f)
+    attr(.x, "recordings") = c(attr(.x, "recordings"), .f)
     return(.x)
   }
   
@@ -227,7 +177,6 @@ delayed.disk.frame <- function(.x, .f, ...) {
   
 #' @export
 #' @rdname cmap
-chunk_lapply <- function (...) {
-  warning("chunk_lapply is deprecated in favour of cmap.disk.frame")
+clapply <- function (...) {
   cmap.disk.frame(...)
 }
diff --git a/R/collect.r b/R/collect.r
index fbcc286a..d86374b2 100644
--- a/R/collect.r
+++ b/R/collect.r
@@ -22,19 +22,8 @@
 #' delete(cars.df)
 #' @export
 #' @rdname collect
-collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
-  cids = get_chunk_ids(x, full.names = T, strip_extension = F)
-  
-  if (parallel) {
-    list_of_data.table = future.apply::future_lapply(cids, function(cid) {
-      get_chunk(x, cid, full.names = TRUE)
-    })
-  } else {
-    list_of_data.table = lapply(cids, function(cid) {
-      get_chunk(x, cid, full.names = TRUE)
-    })
-  }
-  
+collect.disk.frame <- function(x, ...) {
+  list_of_data.table = collect_list(x, ...)
   data.table::rbindlist(list_of_data.table)
 }
 
@@ -50,26 +39,28 @@ collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))
 #' 
 #' # clean up
 #' delete(cars.df)
-collect_list <- function(x, simplify = FALSE, parallel = !is.null(attr(x,"lazyfn"))) {
-  error("do it")
-  # cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
-  # 
-  # 
-  # if(nchunks(x) > 0) {
-  #   res <- NULL
-  #   if (parallel) {
-  #     res = future.apply::future_lapply(cids, function(.x) {
-  #       get_chunk(x, .x, full.names = TRUE)
-  #     })
-  #   } else {
-  #     res = purrr::map(cids, ~get_chunk(x, .x, full.names = TRUE))
-  #   }
-  #   if (simplify) {
-  #     return(simplify2array(res))
-  #   } else {
-  #     return(res)
-  #   }
-  # } else {
-  #   list()
-  # }
+collect_list <- function(x, simplify = FALSE, parallel = !is.null(attr(x,"recordings")), ...) {
+  # get the chunk ids
+  cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
+  
+  if(length(cids) > 0) {
+    list_of_results = NULL
+    if (parallel) {
+      list_of_results = future.apply::future_lapply(cids, function(cid) {
+        get_chunk(x, cid, full.names = TRUE)
+      })
+    } else {
+      list_of_results = lapply(cids, function(cid) {
+        get_chunk(x, cid, full.names = TRUE)
+      })
+    }
+    
+    if (simplify) {
+      return(simplify2array(list_of_results))
+    } else {
+      return(list_of_results)
+    }
+  } else {
+    list()
+  }
 }
diff --git a/R/collect.summarized_disk.frame.r b/R/collect.summarized_disk.frame.r
index 856e1605..583b4d24 100644
--- a/R/collect.summarized_disk.frame.r
+++ b/R/collect.summarized_disk.frame.r
@@ -24,7 +24,7 @@
 #' delete(cars.df)
 #' @export
 #' @rdname collect
-collect.summarized_disk.frame <- function(x, ..., parallel = !is.null(attr(x,"lazyfn"))) {
+collect.summarized_disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
   code_to_run = glue::glue("x %>% {attr(x, 'summarize_code') %>% as.character}")
   class(x) <- "disk.frame"
   eval(parse(text = code_to_run))
diff --git a/R/compute.r b/R/compute.r
index 99d31037..f2a95a4e 100644
--- a/R/compute.r
+++ b/R/compute.r
@@ -1,11 +1,10 @@
-#' Compute without writing
+#' Force computations. The results are stored in a folder.
 #' @description 
 #' Perform the computation; same as calling cmap without .f and lazy = FALSE
 #' @param x a disk.frame
 #' @param outdir the output directory
-#' @param overwrite whether to overwrite or not
-#' @param name Not used. Kept for compatibility with dplyr
-#' @param ... Not used. Kept for dplyr compatibility
+#' @param name If not NULL then used as outdir prefix.
+#' @param ... Passed to `write_disk.frame`
 #' @export
 #' @importFrom dplyr compute
 #' @examples
@@ -17,7 +16,11 @@
 #' # clean up
 #' delete(cars.df)
 #' delete(cars.df3)
-compute.disk.frame <- function(x, name, outdir = tempfile("tmp_df_", fileext=".df"), overwrite = TRUE, ...) {
-  overwrite_check(outdir, overwrite)
-  write_disk.frame(x, outdir = outdir, overwrite = TRUE)
+compute.disk.frame <- function(x, name = NULL, outdir = tempfile("tmp_df_", fileext=".df"), ...) {
+  if (!is.null(name)) {
+    warning("in `compute.disk.frame()` name is not NULL, using `name` file name prefix in temporary `outdir` ")
+    outdir = tempfile(name, fileext=".df")
+  }
+  
+  write_disk.frame(x, outdir = outdir, ...)
 }
diff --git a/R/disk.frame.r b/R/disk.frame.r
index c949f43b..09894efc 100755
--- a/R/disk.frame.r
+++ b/R/disk.frame.r
@@ -213,7 +213,7 @@ is.dir.disk.frame <- function(df, check.consistency = TRUE) {
 head.disk.frame <- function(x, n = 6L, ...) {
   stopifnot(is_ready(x))
   path1 <- attr(x,"path")
-  cmds <- attr(x, "lazyfn")
+  cmds <- attr(x, "recordings")
   if(fs::dir_exists(path1)) {
     path2 <- list.files(path1,full.names = TRUE)[1]
     head(play(fst::read_fst(path2, from = 1, to = n, as.data.table = TRUE), cmds), n = n, ...)
@@ -229,7 +229,7 @@ head.disk.frame <- function(x, n = 6L, ...) {
 tail.disk.frame <- function(x, n = 6L, ...) {
   stopifnot(is_ready(x))
   path1 <- attr(x,"path")
-  cmds <- attr(x, "lazyfn")
+  cmds <- attr(x, "recordings")
   if(dir.exists(path1)) {
     path2 <- list.files(path1,full.names = TRUE)
     path2 <- path2[length(path2)]
diff --git a/R/names.r b/R/names.r
index 10954ad4..2655f80e 100644
--- a/R/names.r
+++ b/R/names.r
@@ -26,7 +26,7 @@ names.disk.frame <- function(x, ...) {
 colnames.disk.frame <- function(x, ...) {
   res = attr(x, "path", exact=TRUE) %>% 
     fs::dir_ls(type="file")
-  if(is.null(attr(x, "lazyfn"))) {
+  if(is.null(attr(x, "recordings"))) {
     if(length(res) == 0) {
       return(vector("character"))
     }
@@ -42,4 +42,4 @@ colnames.disk.frame <- function(x, ...) {
 #' @export
 colnames.default <- function(x, ...) {
   base::colnames(x, ...)
-}
\ No newline at end of file
+}
diff --git a/R/one-stage-verbs.R b/R/one-stage-verbs.R
index 210be4f0..3d3d41ff 100644
--- a/R/one-stage-verbs.R
+++ b/R/one-stage-verbs.R
@@ -209,8 +209,6 @@ IQR_df.collected_agg.disk.frame <- function(listx, ...) {
 #' @rdname group_by
 #' @export
 summarise.grouped_disk.frame <- function(.data, ...) {
-  
-  
   ca_code = generate_summ_code(...)
   
   if(is.null(names(ca_code))) {
@@ -245,16 +243,16 @@ summarize.grouped_disk.frame = summarise.grouped_disk.frame
 #' reorganizes the chunks by the shard key.
 #' @seealso hard_group_by
 #' @param .data a disk.frame
-#' @param add from dplyr
+#' @param .add from dplyr
 #' @param .drop from dplyr
 #' @param ... same as the dplyr::group_by
 #' @importFrom dplyr group_by_drop_default
 #' @export
 #' @rdname group_by
 # learning from https://docs.dask.org/en/latest/dataframe-groupby.html
-group_by.disk.frame <- function(.data, ..., add = FALSE, .drop = dplyr::group_by_drop_default(.data)) {
+group_by.disk.frame <- function(.data, ..., .add = FALSE, .drop = stop(".drop not yet supported")) {
   class(.data) <- c("grouped_disk.frame", "disk.frame")
-  attr(.data, "group_by_cols") = substitute(list(...))[-1]
+  attr(.data, "group_by_cols") = substitute(list(...))
   .data
 }
 
@@ -262,6 +260,8 @@ group_by.disk.frame <- function(.data, ..., add = FALSE, .drop = dplyr::group_by
 #' @importFrom dplyr summarize
 #' @rdname group_by
 summarize.disk.frame <- function(.data, ...) {
+  
+  
   ca_code = generate_summ_code(...)
   
   if(is.null(names(ca_code))) {
@@ -280,14 +280,28 @@ summarize.disk.frame <- function(.data, ...) {
     stop("something's wrong")
   } 
 }
-
-#' Helper function to generate summarisation code
+n_df.chunk_agg.disk.frame
+#' Helper function to generate summarization code
+#' It basically takes something like summarize(tot = sum(1)) and turns it into 
+#' chunk_summarize(res1 = sum_df.chunk_agg.disk.frame(1)) %>% collect
+#' summarize(tot = sum_df.collected_agg.disk.frame(1))
 #' @importFrom data.table setDT setkey
 #' @importFrom utils methods
 #' @noRd
 generate_summ_code <- function(...) {
-  # expand the code
-  code_to_expand = glue::glue("quo(summarise({rlang::as_label(substitute(...))}))")
+  browser()
+  code1 = substitute(chunk_summarize(...))
+  code2 = glue::glue("substitute({deparse(code1)}, list(sum = quote(sum_df.chunk_agg.disk.frame)))")
+  chunk_agg_code = paste0(deparse(eval(parse(text=code2))), collapse="")
+  
+  code1 = substitute(summarize(...))
+  code2 = glue::glue("substitute({deparse(code1)}, list(sum = quote(sum_df.collected_agg.disk.frame)))")
+  collected_agg_code = paste0(deparse(eval(parse(text=code2))), collapse="")
+  
+  code = substitute(list(...))
+  
+  getParseData(parse(text = deparse(code), keep.source = TRUE), includeText = TRUE)
+  
   
   summ_code_quosure = eval(parse(text = code_to_expand))
   #print(summ_code_quosure)
diff --git a/R/util.r b/R/util.r
index 9fabce9e..ef7a8d8f 100644
--- a/R/util.r
+++ b/R/util.r
@@ -24,4 +24,24 @@ gen_datatable_synthetic <- function(N=2e8, K=100) {
     v3 =  sample(round(runif(100,max=100),4), N, TRUE), # numeric e.g. 23.5749
     date1 = sample(seq(as.Date('1970-01-01'), as.Date('2019-01-01'), by = "day"), N, TRUE)  # date
   )
-}
\ No newline at end of file
+}
+
+#' Used to convert a function to from purrr syntax if needed
+#' @param .f a normal function or purrr syntax function i.e. `~{ ...code...}`
+#' @importFrom purrr as_mapper 
+purrr_as_mapper <- function(.f) {
+  if(typeof(.f) == "language") {
+    if(requireNamespace("purrr")) {
+      .f = purrr::as_mapper(.f)
+    } else {
+      code = paste0(deparse(substitute(.f)), collapse = "")
+      stop(
+        sprintf(
+          "in cmap(.x, %s), it appears you are using {purrr} syntax but do not have {purrr} installed. Try `install.packages('purrr')`",
+          code
+        )
+      )
+    }
+  }
+  return(.f)
+}
diff --git a/R/write_disk.frame.r b/R/write_disk.frame.r
index ceab7c15..986d5de0 100644
--- a/R/write_disk.frame.r
+++ b/R/write_disk.frame.r
@@ -2,7 +2,7 @@
 #' @description
 #' Write a data.frame/disk.frame to a disk.frame location. If df is a data.frame
 #' then using the as.disk.frame function is recommended for most cases
-#' @param df a disk.frame
+#' @param diskf a disk.frame
 #' @param outdir output directory for the disk.frame
 #' @param nchunks number of chunks
 #' @param overwrite overwrite output directory
@@ -26,12 +26,12 @@
 #' delete(cars.df)
 #' delete(cars2.df)
 write_disk.frame <- function(
-  df,
+  diskf,
   outdir = tempfile(fileext = ".df"),
   nchunks = ifelse(
-    "disk.frame"%in% class(df),
-    nchunks.disk.frame(df),
-    recommend_nchunks(df)),
+    "disk.frame"%in% class(diskf),
+    nchunks.disk.frame(diskf),
+    recommend_nchunks(diskf)),
   overwrite = FALSE,
   shardby=NULL, compress = 50, shardby_function="hash", sort_splits=NULL, desc_vars=NULL, ...) {
 
@@ -40,16 +40,30 @@ write_disk.frame <- function(
 
 
   if(is.null(outdir)) {
-    stop("outdir must not be NULL")
+    stop("write_disk.frame error: outdir must not be NULL")
   }
 
-  if(is_disk.frame(df)) {
+  if(is_disk.frame(diskf)) {
     if(is.null(shardby)) {
-      cmap.disk.frame(df, ~.x, outdir = outdir, lazy = FALSE, ..., compress = compress, overwrite = TRUE)
+      path = attr(diskf, "path")
+      files_shortname <- list.files(path)
+      cids = get_chunk_ids(diskf, full.names = T, strip_extension = F)
+      
+      future.apply::future_lapply(1:length(cids), function(ii, ...) {
+        chunk = get_chunk(diskf, cids[ii], full.names = TRUE)
+        if(nrow(chunk) == 0) {
+          warning(sprintf("The output chunk has 0 row, therefore chunk %d NOT written", ii))
+        } else {
+          out_chunk_name = file.path(outdir, files_shortname[ii])
+          fst::write_fst(chunk, out_chunk_name, compress)
+          return(files_shortname)
+        }
+        NULL # return NULL
+      }, ...)
+      return(disk.frame(outdir))
     } else {
       # TODO really inefficient
-      #df2 = cmap.disk.frame(df, ~.x, outdir = outdir, lazy = FALSE, ..., compress = compress, overwrite = TRUE)
-      shard(df,
+      shard(diskf,
             outdir = outdir,
             nchunks = nchunks,
             overwrite = TRUE,
@@ -60,9 +74,9 @@ write_disk.frame <- function(
             ...
             )
     }
-  } else if ("data.frame" %in% class(df)) {
-    if(".out.disk.frame.id" %in% names(df)) {
-      df[,{
+  } else if ("data.frame" %in% class(diskf)) {
+    if(".out.disk.frame.id" %in% names(diskf)) {
+      diskf[,{
         if (base::nrow(.SD) > 0) {
           list_columns = purrr::map_lgl(.SD, is.list)
           if(any(list_columns)){
@@ -70,17 +84,17 @@ write_disk.frame <- function(
           } else {
             fst::write_fst(.SD, file.path(outdir, paste0(.BY, ".fst")), compress = compress)
             NULL
-            }
           }
+        }
         NULL
       }, .out.disk.frame.id]
       res = disk.frame(outdir)
       add_meta(res, shardkey = shardby, shardchunks = nchunks, compress = compress)
     } else {
-      as.disk.frame(df, outdir = outdir, nchunks = nchunks, overwrite = TRUE, shardby = shardby, compress = compress, ...)
+      as.disk.frame(diskf, outdir = outdir, nchunks = nchunks, overwrite = TRUE, shardby = shardby, compress = compress, ...)
     }
   } else {
-    stop("write_disk.frame error: df must be a disk.frame or data.frame")
+    stop("write_disk.frame error: diskf must be a disk.frame or data.frame")
   }
 }
 
diff --git a/R/zip_to_disk.frame.r b/R/zip_to_disk.frame.r
index f90c3810..cae1eb65 100644
--- a/R/zip_to_disk.frame.r
+++ b/R/zip_to_disk.frame.r
@@ -5,7 +5,7 @@
 #' @param ... passed to fread
 #' @param validation.check should the function perform a check at the end to check for validity of output. It can detect issues with conversion
 #' @param overwrite overwrite output directory
-#' @import fst fs
+#' @import fst
 #' @importFrom glue glue
 #' @importFrom future.apply future_lapply
 #' @importFrom utils unzip
@@ -33,37 +33,27 @@
 zip_to_disk.frame = function(zipfile, outdir, ..., validation.check = FALSE, overwrite = TRUE) {
   files = unzip(zipfile, list=TRUE)
   
-  fs::dir_create(outdir)
+  if(!dir.exists(outdir)) {
+    dir.create(outdir)
+  }
   
   tmpdir = tempfile(pattern = "tmp_zip2csv")
-  
-  dotdotdots = list(...)
-  
-  dfs = future.apply::future_lapply(files$Name, function(fn) {
-  #dfs = lapply(files$Name, function(fn) {
+
+  dfs = future.apply::future_lapply(files$Name, function(fn, ...) {
     outdfpath = file.path(outdir, fn)
     overwrite_check(outdfpath, TRUE)
     unzip(zipfile, files = fn, exdir = tmpdir)
-    
-    # lift the domain of csv_to_disk.frame so it accepts a list
-    cl = purrr::lift(csv_to_disk.frame)
-    
-    ok = c(
-      list(infile = file.path(tmpdir, fn), outdir = outdfpath, overwrite = overwrite),
-      dotdotdots)
-    
-    #csv_to_disk.frame(, outdfpath, overwrite = overwrite, ...)
-    cl(ok)
-  })
+    csv_to_disk.frame(infile = file.path(tmpdir, fn), outdir = outdfpath, overwrite = overwrite, ...)
+  }, ...)
 
   dfs  
 }
 
-#' `validate_zip_to_disk.frame` is used to validate and auto-correct read and convert every single file within the zip file to df format
+#' `validate_zip_to_disk.frame` is used to validate and auto-correct read and convert every single file within the zip file to disk.frame format
 #' @importFrom glue glue
 #' @importFrom utils unzip
 #' @importFrom data.table timetaken fread
-#' @import fst
+#' @importFrom fst read_fst
 #' @rdname zip_to_disk.frame
 #' @noRd
 validate_zip_to_disk.frame = function(zipfile, outdir) {
@@ -86,14 +76,14 @@ validate_zip_to_disk.frame = function(zipfile, outdir) {
         # read it and if it errors then the file might be corrupted, so 
         # read it again and write again
         pt = proc.time()
-        read_fst(out_fst_file, as.data.table = TRUE)
+        fst::read_fst(out_fst_file, as.data.table = TRUE)
         message(paste0("checking(read): ", timetaken(pt))); pt = proc.time()
       }, error = function(e) {
         message(e)
         pt = proc.time()
         unzip(zipfile, files = fn, exdir = tmpdir)
         message(paste0("unzip: ", timetaken(pt))); pt = proc.time()
-        write_fst(fread(file.path(tmpdir, fn)), out_fst_file,100)
+        fst::write_fst(data.table::fread(file.path(tmpdir, fn)), out_fst_file,100)
         message(paste0("read: ", timetaken(pt)))
         unlink(file.path(tmpdir, fn))
         gc()
@@ -106,7 +96,7 @@ validate_zip_to_disk.frame = function(zipfile, outdir) {
       pt = proc.time()
       unzip(zipfile, files = fn, exdir = tmpdir)
       message(paste0("unzip: ", timetaken(pt))); pt = proc.time()
-      write_fst(fread(file.path(tmpdir, fn)), out_fst_file,100)
+      fst::write_fst(data.table::fread(file.path(tmpdir, fn)), out_fst_file,100)
       message(paste0("read: ", timetaken(pt)))
       unlink(file.path(tmpdir, fn))
       gc()
diff --git a/man/cmap.Rd b/man/cmap.Rd
index 8479a2d4..61a76e2e 100644
--- a/man/cmap.Rd
+++ b/man/cmap.Rd
@@ -12,23 +12,12 @@
 \alias{lazy}
 \alias{lazy.disk.frame}
 \alias{delayed}
-\alias{chunk_lapply}
+\alias{clapply}
 \title{Apply the same function to all chunks}
 \usage{
 cmap(.x, .f, ...)
 
-\method{cmap}{disk.frame}(
-  .x,
-  .f,
-  ...,
-  outdir = NULL,
-  keep = NULL,
-  chunks = nchunks(.x),
-  compress = 50,
-  lazy = TRUE,
-  overwrite = FALSE,
-  .progress = TRUE
-)
+\method{cmap}{disk.frame}(.x, .f, ..., outdir = NULL, lazy = TRUE, overwrite = FALSE)
 
 cmap_dfr(.x, .f, ..., .id = NULL)
 
@@ -66,36 +55,24 @@ lazy(.x, .f, ...)
 
 delayed(.x, .f, ...)
 
-chunk_lapply(...)
+clapply(...)
 }
 \arguments{
 \item{.x}{a disk.frame}
 
 \item{.f}{a function to apply to each of the chunks}
 
-\item{...}{for compatibility with `purrr::map`}
+\item{...}{Passed to `collect` and `write_disk.frame`}
 
 \item{outdir}{the output directory}
 
-\item{keep}{the columns to keep from the input}
-
-\item{chunks}{The number of chunks to output}
-
-\item{compress}{0-100 fst compression ratio}
-
 \item{lazy}{if TRUE then do this lazily}
 
-\item{overwrite}{if TRUE removes any existing chunks in the data}
-
-\item{.progress}{A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}}
-
 \item{use.names}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{fill}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{idcol}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
-
-\item{vars_and_pkgs}{variables and packages to send to a background session. This is typically automatically detected}
 }
 \description{
 Apply the same function to all chunks
diff --git a/man/collect.Rd b/man/collect.Rd
index bf6651b9..4e2e5d67 100644
--- a/man/collect.Rd
+++ b/man/collect.Rd
@@ -6,25 +6,30 @@
 \alias{collect.summarized_disk.frame}
 \title{Bring the disk.frame into R}
 \usage{
-\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "recordings")))
+\method{collect}{disk.frame}(x, ...)
 
-collect_list(x, simplify = FALSE, parallel = !is.null(attr(x, "lazyfn")))
+collect_list(
+  x,
+  simplify = FALSE,
+  parallel = !is.null(attr(x, "recordings")),
+  ...
+)
 
-\method{collect}{summarized_disk.frame}(x, ..., parallel = !is.null(attr(x, "lazyfn")))
+\method{collect}{summarized_disk.frame}(x, ..., parallel = !is.null(attr(x, "recordings")))
 }
 \arguments{
 \item{x}{a disk.frame}
 
 \item{...}{not used}
 
+\item{simplify}{Should the result be simplified to array}
+
 \item{parallel}{if TRUE the collection is performed in parallel. By default
 if there are delayed/lazy steps then it will be parallel, otherwise it will
 not be in parallel. This is because parallel requires transferring data
 from background R session to the current R session and if there is no
 computation then it's better to avoid transferring data between session,
 hence parallel = FALSE is a better choice}
-
-\item{simplify}{Should the result be simplified to array}
 }
 \value{
 collect return a data.frame/data.table
diff --git a/man/compute.disk.frame.Rd b/man/compute.disk.frame.Rd
index 57f1c6e2..e4de9e2d 100644
--- a/man/compute.disk.frame.Rd
+++ b/man/compute.disk.frame.Rd
@@ -2,26 +2,18 @@
 % Please edit documentation in R/compute.r
 \name{compute.disk.frame}
 \alias{compute.disk.frame}
-\title{Compute without writing}
+\title{Force computations. The results are stored in a folder.}
 \usage{
-\method{compute}{disk.frame}(
-  x,
-  name,
-  outdir = tempfile("tmp_df_", fileext = ".df"),
-  overwrite = TRUE,
-  ...
-)
+\method{compute}{disk.frame}(x, name = NULL, outdir = tempfile("tmp_df_", fileext = ".df"), ...)
 }
 \arguments{
 \item{x}{a disk.frame}
 
-\item{name}{Not used. Kept for compatibility with dplyr}
+\item{name}{If not NULL then used as outdir prefix.}
 
 \item{outdir}{the output directory}
 
-\item{overwrite}{whether to overwrite or not}
-
-\item{...}{Not used. Kept for dplyr compatibility}
+\item{...}{Passed to `write_disk.frame`}
 }
 \description{
 Perform the computation; same as calling cmap without .f and lazy = FALSE
diff --git a/man/group_by.Rd b/man/group_by.Rd
index 1bb0d4a2..d65a3437 100644
--- a/man/group_by.Rd
+++ b/man/group_by.Rd
@@ -12,7 +12,7 @@
 
 \method{summarize}{grouped_disk.frame}(.data, ...)
 
-\method{group_by}{disk.frame}(.data, ..., add = FALSE, .drop = dplyr::group_by_drop_default(.data))
+\method{group_by}{disk.frame}(.data, ..., .add = FALSE, .drop = stop(".drop not yet supported"))
 
 \method{summarize}{disk.frame}(.data, ...)
 
@@ -23,7 +23,7 @@
 
 \item{...}{same as the dplyr::group_by}
 
-\item{add}{from dplyr}
+\item{.add}{from dplyr}
 
 \item{.drop}{from dplyr}
 }
diff --git a/man/write_disk.frame.Rd b/man/write_disk.frame.Rd
index 88977489..60c2bf09 100644
--- a/man/write_disk.frame.Rd
+++ b/man/write_disk.frame.Rd
@@ -6,10 +6,10 @@
 \title{Write disk.frame to disk}
 \usage{
 write_disk.frame(
-  df,
+  diskf,
   outdir = tempfile(fileext = ".df"),
-  nchunks = ifelse("disk.frame" \%in\% class(df), nchunks.disk.frame(df),
-    recommend_nchunks(df)),
+  nchunks = ifelse("disk.frame" \%in\% class(diskf), nchunks.disk.frame(diskf),
+    recommend_nchunks(diskf)),
   overwrite = FALSE,
   shardby = NULL,
   compress = 50,
@@ -22,7 +22,7 @@ write_disk.frame(
 output_disk.frame(...)
 }
 \arguments{
-\item{df}{a disk.frame}
+\item{diskf}{a disk.frame}
 
 \item{outdir}{output directory for the disk.frame}
 
diff --git a/tests/testthat/test-compute.r b/tests/testthat/test-compute.r
index 3a1bd56e..96168024 100644
--- a/tests/testthat/test-compute.r
+++ b/tests/testthat/test-compute.r
@@ -2,51 +2,51 @@ context("test-compute")
 
 setup({
   setup_disk.frame(workers = 2)
-  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(),"tmp_compute_delete"), overwrite=T)
+  diskf = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(),"tmp_compute_delete"), overwrite=T)
 })
 
 test_that("compute works on simple data", {
-  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
-  dff = compute(df)
+  diskf = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  diskff = compute(diskf)
   
-  expect_equal(nrow(dff), 1e5+11)
-  expect_s3_class(dff, "disk.frame")
+  expect_equal(nrow(diskff), 1e5+11)
+  expect_s3_class(diskff, "disk.frame")
 })
 
 test_that("compute works on lazy stream", {
-  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
-  df = cmap(df, lazy = T, ~{
+  diskf = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  diskf = cmap(diskf, lazy = T, ~{
     .x[1:10, ]
   })
-  dff = compute(df)
-  expect_equal(nrow(dff), nchunks(df)*10)
-  expect_s3_class(dff, "disk.frame")
+  diskff = compute(diskf)
+  expect_equal(nrow(diskff), nchunks(diskf)*10)
+  expect_s3_class(diskff, "disk.frame")
 })
 
 test_that("compute works on lazy stream followed by dplyr", {
-  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
-  df = cmap(df, lazy = T, ~{
+  diskf = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  diskf = cmap(diskf, lazy = T, ~{
     .x[1:10, ]
   }) %>% select(id1, id4)
   
-  dff = compute(df)
-  expect_equal(nrow(dff), nchunks(df)*10)
-  expect_equal(ncol(dff), 2)
-  expect_s3_class(dff, "disk.frame")
+  diskff = compute(diskf)
+  expect_equal(nrow(diskff), nchunks(diskf)*10)
+  expect_equal(ncol(diskff), 2)
+  expect_s3_class(diskff, "disk.frame")
 })
 
 
 test_that("compute works on dplyr::select followed by lazy", {
-  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
-  df = df %>% select(id1, id4) %>%
+  diskf = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  diskf = diskf %>% select(id1, id4) %>%
     cmap(lazy = T, ~{
       .x[1:10, ]
     })
   
-  dff = dplyr::collect(df)
-  expect_equal(nrow(dff), nchunks(df)*10)
-  expect_equal(ncol(dff), 2)
-  expect_s3_class(dff, "data.frame")
+  diskff = dplyr::collect(diskf)
+  expect_equal(nrow(diskff), nchunks(diskf)*10)
+  expect_equal(ncol(diskff), 2)
+  expect_s3_class(diskff, "data.frame")
 })
 
 
diff --git a/tests/testthat/test-csv2disk.frame.r b/tests/testthat/test-csv2disk.frame.r
index dcc73652..3d78482b 100644
--- a/tests/testthat/test-csv2disk.frame.r
+++ b/tests/testthat/test-csv2disk.frame.r
@@ -13,8 +13,16 @@ test_that("csv2disk.frame works with no shard", {
     file.path(tempdir(), "tmp_pls_delete_csv2df.df"), 
     overwrite=TRUE, 
     nchunks=max(2, recommend_nchunks(file.size(file.path(tempdir(), "tmp_pls_delete_csv2df.csv")))))
-  dff1 = dff[,sum(v1), id1]
-  dff2 = dff1[,sum(V1), id1]
+  
+  dff1 = dff %>% 
+    group_by(id1) %>% 
+    summarize(sum(V1)) %>% 
+    collect
+  
+  dff2 = dff1 %>% 
+    group_by(id1) %>% 
+    summarize(sum(V1))
+  
   expect_false(nrow(dff1) == nrow(dff2))
   expect_equal(nrow(dff), 1e3+11)
   expect_equal(ncol(dff), 10)

From 32e156ea5b99ec15b817fd7705b3b5298852cb18 Mon Sep 17 00:00:00 2001
From: xiaodaigh <zhuojia.dai@gmail.com>
Date: Fri, 12 Mar 2021 16:45:55 +1100
Subject: [PATCH 3/9] some docs

---
 man/chunk_group_by.Rd  | 20 +-------------------
 man/cmap.Rd            | 14 +++++++++++++-
 man/collect.Rd         |  6 +++---
 man/dplyr_verbs.Rd     |  6 ++++++
 man/purrr_as_mapper.Rd | 14 ++++++++++++++
 5 files changed, 37 insertions(+), 23 deletions(-)
 create mode 100644 man/purrr_as_mapper.Rd

diff --git a/man/chunk_group_by.Rd b/man/chunk_group_by.Rd
index cbe17485..f06836c2 100644
--- a/man/chunk_group_by.Rd
+++ b/man/chunk_group_by.Rd
@@ -5,10 +5,7 @@
 \alias{chunk_summarise}
 \alias{chunk_group_by}
 \alias{chunk_ungroup}
-\title{#' @export
-#' @importFrom dplyr tally
-#' @rdname dplyr_verbs
-tally.disk.frame <- create_chunk_mapper(dplyr::tally)}
+\title{Group by within each disk.frame}
 \usage{
 chunk_summarize(.data, ...)
 
@@ -24,26 +21,11 @@ chunk_ungroup(.data, ...)
 \item{...}{passed to dplyr::group_by}
 }
 \description{
-#' @export
-#' @importFrom dplyr count
-#' @rdname dplyr_verbs
-count.disk.frame <- create_chunk_mapper(dplyr::count)
-#' @export
-#' @importFrom dplyr add_count
-#' @rdname dplyr_verbs
-add_count.disk.frame <- create_chunk_mapper(dplyr::add_count)
-
 The disk.frame group by operation perform group WITHIN each chunk. This is
 often used for performance reasons. If the user wishes to perform group-by,
 they may choose to use the `hard_group_by` function which is expensive as it
 reorganizes the chunks by the shard key.
 }
-\details{
-#' @export
-#' @importFrom dplyr add_tally
-#' @rdname dplyr_verbs
-add_tally.disk.frame <- create_chunk_mapper(dplyr::add_tally)
-}
 \seealso{
 hard_group_by group_by
 }
diff --git a/man/cmap.Rd b/man/cmap.Rd
index 61a76e2e..cb462a42 100644
--- a/man/cmap.Rd
+++ b/man/cmap.Rd
@@ -17,7 +17,19 @@
 \usage{
 cmap(.x, .f, ...)
 
-\method{cmap}{disk.frame}(.x, .f, ..., outdir = NULL, lazy = TRUE, overwrite = FALSE)
+\method{cmap}{disk.frame}(
+  .x,
+  .f,
+  ...,
+  outdir = NULL,
+  keep = NULL,
+  chunks = nchunks(.x),
+  compress = 50,
+  lazy = TRUE,
+  overwrite = FALSE,
+  vars_and_pkgs = future::getGlobalsAndPackages(.f, envir = parent.frame()),
+  .progress = TRUE
+)
 
 cmap_dfr(.x, .f, ..., .id = NULL)
 
diff --git a/man/collect.Rd b/man/collect.Rd
index 4e2e5d67..0e74f39f 100644
--- a/man/collect.Rd
+++ b/man/collect.Rd
@@ -6,7 +6,7 @@
 \alias{collect.summarized_disk.frame}
 \title{Bring the disk.frame into R}
 \usage{
-\method{collect}{disk.frame}(x, ...)
+\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "lazyfn")))
 
 collect_list(
   x,
@@ -22,14 +22,14 @@ collect_list(
 
 \item{...}{not used}
 
-\item{simplify}{Should the result be simplified to array}
-
 \item{parallel}{if TRUE the collection is performed in parallel. By default
 if there are delayed/lazy steps then it will be parallel, otherwise it will
 not be in parallel. This is because parallel requires transferring data
 from background R session to the current R session and if there is no
 computation then it's better to avoid transferring data between session,
 hence parallel = FALSE is a better choice}
+
+\item{simplify}{Should the result be simplified to array}
 }
 \value{
 collect return a data.frame/data.table
diff --git a/man/dplyr_verbs.Rd b/man/dplyr_verbs.Rd
index cfebebb4..c45f3144 100644
--- a/man/dplyr_verbs.Rd
+++ b/man/dplyr_verbs.Rd
@@ -8,6 +8,8 @@
 \alias{transmute.disk.frame}
 \alias{arrange.disk.frame}
 \alias{chunk_arrange}
+\alias{add_count.disk.frame}
+\alias{add_tally.disk.frame}
 \alias{distinct.disk.frame}
 \alias{chunk_distinct}
 \alias{glimpse.disk.frame}
@@ -27,6 +29,10 @@
 
 chunk_arrange(.data, ...)
 
+add_count.disk.frame(.data, ...)
+
+add_tally.disk.frame(.data, ...)
+
 \method{distinct}{disk.frame}(...)
 
 chunk_distinct(.data, ...)
diff --git a/man/purrr_as_mapper.Rd b/man/purrr_as_mapper.Rd
new file mode 100644
index 00000000..b7071d7b
--- /dev/null
+++ b/man/purrr_as_mapper.Rd
@@ -0,0 +1,14 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/util.r
+\name{purrr_as_mapper}
+\alias{purrr_as_mapper}
+\title{Used to convert a function to from purrr syntax if needed}
+\usage{
+purrr_as_mapper(.f)
+}
+\arguments{
+\item{.f}{a normal function or purrr syntax function i.e. `~{ ...code...}`}
+}
+\description{
+Used to convert a function to from purrr syntax if needed
+}

From 2147f229fc23a3ff0b582fc30c13f50484d6d2f7 Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Mon, 24 Jan 2022 21:48:56 +1100
Subject: [PATCH 4/9] updated development

---
 .Rbuildignore                           |   4 +-
 CRAN-RELEASE                            |   4 +-
 DESCRIPTION                             |   2 +-
 R/shard.r                               |   2 +-
 src/RcppExports.cpp                     |   5 +
 tests/testthat.R                        |   4 +
 tests/testthat/test-Rcpp.R              |   6 +
 tests/testthat/test-add-chunk.r         |  65 +++++
 tests/testthat/test-anti_join.R         |  75 ++++++
 tests/testthat/test-as-data-frame.R     |  14 ++
 tests/testthat/test-as-disk-frame.R     |  15 ++
 tests/testthat/test-bloom-filter.r      |  16 ++
 tests/testthat/test-collect.R           |  57 +++++
 tests/testthat/test-compute.r           |  55 +++++
 tests/testthat/test-csv2disk.frame.r    |  84 +++++++
 tests/testthat/test-data-table.r        |  41 ++++
 tests/testthat/test-delete.r            |  20 ++
 tests/testthat/test-disk-frame.r        |  34 +++
 tests/testthat/test-dplyr-verbs.r       | 175 ++++++++++++++
 tests/testthat/test-dtplyr-support.r    |  46 ++++
 tests/testthat/test-foverlaps.r         |  42 ++++
 tests/testthat/test-full_join.R         |  58 +++++
 tests/testthat/test-get_chunk.r         |  17 ++
 tests/testthat/test-get_chunk_ids.r     |  20 ++
 tests/testthat/test-glm.r               |  30 +++
 tests/testthat/test-group-by.R          | 309 ++++++++++++++++++++++++
 tests/testthat/test-hard-arrange.R      | 111 +++++++++
 tests/testthat/test-inner_join.R        |  64 +++++
 tests/testthat/test-is-disk.frame.r     |  12 +
 tests/testthat/test-left_join.R         |  71 ++++++
 tests/testthat/test-map.r               |  76 ++++++
 tests/testthat/test-map2.r              |  46 ++++
 tests/testthat/test-merge.r             |  59 +++++
 tests/testthat/test-names.r             |  25 ++
 tests/testthat/test-nchunks.r           |  18 ++
 tests/testthat/test-nrow-ncol.R         |  20 ++
 tests/testthat/test-overwrite_check.r   |  21 ++
 tests/testthat/test-pls-add.r           |  44 ++++
 tests/testthat/test-print.r             |  14 ++
 tests/testthat/test-pull.r              |  50 ++++
 tests/testthat/test-rbindlist.r         |  31 +++
 tests/testthat/test-rechunk.r           |  82 +++++++
 tests/testthat/test-recommend_nchunk.R  |  16 ++
 tests/testthat/test-remove_chunk.r      |  18 ++
 tests/testthat/test-right_join.r        |   7 +
 tests/testthat/test-sample_frac.r       |  20 ++
 tests/testthat/test-sample_n.r          |  16 ++
 tests/testthat/test-sas_to_csv.r        |   8 +
 tests/testthat/test-sas_to_disk.frame.r |  10 +
 tests/testthat/test-semi_join.R         |  72 ++++++
 tests/testthat/test-setup.r             |   7 +
 tests/testthat/test-shard.r             |  28 +++
 tests/testthat/test-shardkey.r          |  17 ++
 tests/testthat/test-sql_query.r         |  21 ++
 tests/testthat/test-srckeep.r           |  17 ++
 tests/testthat/test-tbl_vars.r          |  16 ++
 tests/testthat/test-util.r              |   8 +
 tests/testthat/test-write_disk.frame.R  |  39 +++
 tests/testthat/test-zip_to_disk.frame.r |   7 +
 59 files changed, 2266 insertions(+), 5 deletions(-)
 create mode 100644 tests/testthat.R
 create mode 100644 tests/testthat/test-Rcpp.R
 create mode 100644 tests/testthat/test-add-chunk.r
 create mode 100644 tests/testthat/test-anti_join.R
 create mode 100644 tests/testthat/test-as-data-frame.R
 create mode 100644 tests/testthat/test-as-disk-frame.R
 create mode 100644 tests/testthat/test-bloom-filter.r
 create mode 100644 tests/testthat/test-collect.R
 create mode 100644 tests/testthat/test-compute.r
 create mode 100644 tests/testthat/test-csv2disk.frame.r
 create mode 100644 tests/testthat/test-data-table.r
 create mode 100644 tests/testthat/test-delete.r
 create mode 100644 tests/testthat/test-disk-frame.r
 create mode 100644 tests/testthat/test-dplyr-verbs.r
 create mode 100644 tests/testthat/test-dtplyr-support.r
 create mode 100644 tests/testthat/test-foverlaps.r
 create mode 100644 tests/testthat/test-full_join.R
 create mode 100644 tests/testthat/test-get_chunk.r
 create mode 100644 tests/testthat/test-get_chunk_ids.r
 create mode 100644 tests/testthat/test-glm.r
 create mode 100644 tests/testthat/test-group-by.R
 create mode 100644 tests/testthat/test-hard-arrange.R
 create mode 100644 tests/testthat/test-inner_join.R
 create mode 100644 tests/testthat/test-is-disk.frame.r
 create mode 100644 tests/testthat/test-left_join.R
 create mode 100644 tests/testthat/test-map.r
 create mode 100644 tests/testthat/test-map2.r
 create mode 100644 tests/testthat/test-merge.r
 create mode 100644 tests/testthat/test-names.r
 create mode 100644 tests/testthat/test-nchunks.r
 create mode 100644 tests/testthat/test-nrow-ncol.R
 create mode 100644 tests/testthat/test-overwrite_check.r
 create mode 100644 tests/testthat/test-pls-add.r
 create mode 100644 tests/testthat/test-print.r
 create mode 100644 tests/testthat/test-pull.r
 create mode 100644 tests/testthat/test-rbindlist.r
 create mode 100644 tests/testthat/test-rechunk.r
 create mode 100644 tests/testthat/test-recommend_nchunk.R
 create mode 100644 tests/testthat/test-remove_chunk.r
 create mode 100644 tests/testthat/test-right_join.r
 create mode 100644 tests/testthat/test-sample_frac.r
 create mode 100644 tests/testthat/test-sample_n.r
 create mode 100644 tests/testthat/test-sas_to_csv.r
 create mode 100644 tests/testthat/test-sas_to_disk.frame.r
 create mode 100644 tests/testthat/test-semi_join.R
 create mode 100644 tests/testthat/test-setup.r
 create mode 100644 tests/testthat/test-shard.r
 create mode 100644 tests/testthat/test-shardkey.r
 create mode 100644 tests/testthat/test-sql_query.r
 create mode 100644 tests/testthat/test-srckeep.r
 create mode 100644 tests/testthat/test-tbl_vars.r
 create mode 100644 tests/testthat/test-util.r
 create mode 100644 tests/testthat/test-write_disk.frame.R
 create mode 100644 tests/testthat/test-zip_to_disk.frame.r

diff --git a/.Rbuildignore b/.Rbuildignore
index 5c5d5b95..f79a88c1 100644
--- a/.Rbuildignore
+++ b/.Rbuildignore
@@ -1,3 +1,5 @@
+^renv$
+^renv\.lock$
 ^.*\.Rproj$
 ^\.github$
 ^manuscript$
@@ -65,4 +67,4 @@ vignettes.Rnw.template
 ^codecov\.yml$
 new-nse-dev.r
 test-poorman.R
-*.parquet
\ No newline at end of file
+.parquet$
diff --git a/CRAN-RELEASE b/CRAN-RELEASE
index 48d603de..1fc9560f 100644
--- a/CRAN-RELEASE
+++ b/CRAN-RELEASE
@@ -1,2 +1,2 @@
-This package was submitted to CRAN on 2021-03-12.
-Once it is accepted, delete this file and tag the release (commit 34bafaa).
+This package was submitted to CRAN on 2021-05-13.
+Once it is accepted, delete this file and tag the release (commit 01d247f).
diff --git a/DESCRIPTION b/DESCRIPTION
index 0f848ee8..0307f9a4 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -52,7 +52,7 @@ Suggests:
     covr
 LinkingTo: 
     Rcpp
-RoxygenNote: 7.1.1
+RoxygenNote: 7.1.2
 Encoding: UTF-8
 URL: https://diskframe.com
 BugReports: https://github.com/xiaodaigh/disk.frame/issues
diff --git a/R/shard.r b/R/shard.r
index e3b9285c..33f989fb 100644
--- a/R/shard.r
+++ b/R/shard.r
@@ -26,7 +26,7 @@ shard <- function(df, shardby, outdir = tempfile(fileext = ".df"), ..., nchunks
   if("data.frame" %in% class(df)) {
     data.table::setDT(df)
     if(shardby_function == "hash"){
-      message("Hashing...")
+      # message("Hashing...")
       if(length(shardby) == 1) {
         code = glue::glue("df[,.out.disk.frame.id := hashstr2i(as.character({shardby}), nchunks)]")
       } else {
diff --git a/src/RcppExports.cpp b/src/RcppExports.cpp
index 613bb16b..49f19db7 100644
--- a/src/RcppExports.cpp
+++ b/src/RcppExports.cpp
@@ -5,6 +5,11 @@
 
 using namespace Rcpp;
 
+#ifdef RCPP_USE_GLOBAL_ROSTREAM
+Rcpp::Rostream<true>&  Rcpp::Rcout = Rcpp::Rcpp_cout_get();
+Rcpp::Rostream<false>& Rcpp::Rcerr = Rcpp::Rcpp_cerr_get();
+#endif
+
 // hashstr2i
 NumericVector hashstr2i(std::vector< std::string > x, int ngrps, int prime1, int prime2, int prime3);
 RcppExport SEXP _disk_frame_hashstr2i(SEXP xSEXP, SEXP ngrpsSEXP, SEXP prime1SEXP, SEXP prime2SEXP, SEXP prime3SEXP) {
diff --git a/tests/testthat.R b/tests/testthat.R
new file mode 100644
index 00000000..6681ff05
--- /dev/null
+++ b/tests/testthat.R
@@ -0,0 +1,4 @@
+library(testthat)
+library(disk.frame)
+
+test_check("disk.frame")
diff --git a/tests/testthat/test-Rcpp.R b/tests/testthat/test-Rcpp.R
new file mode 100644
index 00000000..d4144ca9
--- /dev/null
+++ b/tests/testthat/test-Rcpp.R
@@ -0,0 +1,6 @@
+context("test-RcppExprts")
+
+
+test_that("testing Rccpexports nothing here", {
+  expect_equal(2L, 2L)
+})
\ No newline at end of file
diff --git a/tests/testthat/test-add-chunk.r b/tests/testthat/test-add-chunk.r
new file mode 100644
index 00000000..c6b38a73
--- /dev/null
+++ b/tests/testthat/test-add-chunk.r
@@ -0,0 +1,65 @@
+context("test-add-chunk")
+
+setup({
+  setup_disk.frame(workers = 2)
+})
+
+test_that("guard against github 292", {
+  a = data.frame(a = as.Date("2020-07-01"), b = runif(1e6))
+  
+  a.df = as.disk.frame(a)
+  
+  head(a.df)
+  
+  expect_s3_class(add_chunk(a.df, a), "disk.frame")
+  delete(a.df)
+})
+
+test_that("testing add chunk without naming chunk_id", {
+  a = data.frame(a = 1:100, b = 1:100)
+  
+  a1 = as.disk.frame(a, overwrite = TRUE)
+  
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  add_chunk(a1, b)
+  expect_equal(nrow(a1), 200)
+  
+  add_chunk(a1, d)
+  expect_equal(nrow(a1), 250)
+  
+  delete(a1)
+})
+
+test_that("testing add chunk by naming chunk_id", {
+  a = data.frame(a = 1:100, b = 1:100)
+  
+  a1 = as.disk.frame(a, overwrite = TRUE)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  add_chunk(a1, b, chunk_id = nchunks(a1)+2)
+  expect_equal(nrow(a1), 200)
+  
+  add_chunk(a1, d, chunk_id = nchunks(a1)+2)
+  expect_equal(nrow(a1), 250)
+  
+  delete(a1)
+})
+
+test_that("testing add chunk by using compression", {
+  a = data.frame(a = 1:100, b = 1:100)
+  
+  a1 = as.disk.frame(a, overwrite = TRUE)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  add_chunk(a1, b, compress=50)
+  expect_equal(nrow(a1), 200)
+  
+  delete(a1)
+})
+
+teardown({
+})
\ No newline at end of file
diff --git a/tests/testthat/test-anti_join.R b/tests/testthat/test-anti_join.R
new file mode 100644
index 00000000..348ebaf2
--- /dev/null
+++ b/tests/testthat/test-anti_join.R
@@ -0,0 +1,75 @@
+context("test-anti_join")
+
+setup({
+  setup_disk.frame(workers = 2)
+  
+  a = data.frame(a = 1:100, b = 1:100)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_aj.df"), nchunks = 4, overwrite = TRUE)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_aj.df"), nchunks = 5, overwrite = TRUE)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_aj.df"), overwrite = TRUE)
+
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_aj2.df"), nchunks = 4, overwrite = TRUE)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_aj2.df"), nchunks = 5, overwrite = TRUE)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_aj2.df"), overwrite = TRUE)
+})
+
+test_that("testing anti_join where right is data.frame", {
+  #skip_on_cran()
+  a = disk.frame(file.path(tempdir(), "tmp_a_aj.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_aj.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_aj.df"))
+  bc = collect(b)
+  dc = collect(d)
+  
+  abc = anti_join(a, bc, by = "a") %>% collect
+  expect_equal(nrow(abc), 50)
+  
+  abc0 = anti_join(a, bc, by = c("a","b")) %>% collect
+  expect_equal(nrow(abc0), 100)
+  
+  abc100 = anti_join(a, bc, by = "b") %>% collect
+  expect_equal(nrow(abc100), 0)
+  
+  abd50 = anti_join(a, dc, by = "b") %>% collect
+  expect_equal(nrow(abd50), 50)
+})
+
+test_that("testing anti_join where right is disk.frame", {
+  #skip_on_cran()
+  a = disk.frame(file.path(tempdir(),"tmp_a_aj2.df"))
+  b = disk.frame(file.path(tempdir(),"tmp_b_aj2.df"))
+  d = disk.frame(file.path(tempdir(),"tmp_d_aj2.df"))
+  
+  expect_warning({
+    ab <- anti_join(a, b, by = "a", merge_by_chunk_id = FALSE) %>% collect
+    })
+  expect_equal(nrow(ab), 50)
+  
+  expect_warning({
+    ab0 = anti_join(a, b, by = c("a","b"), merge_by_chunk_id = FALSE) %>% collect
+    })
+  expect_equal(nrow(ab0), 100)
+  
+  expect_warning({
+    ab100 = anti_join(a, b, by = "b", merge_by_chunk_id = FALSE) %>% collect
+    })
+  expect_equal(nrow(ab100), 0)
+  
+  expect_warning({
+    ad50 = anti_join(a, d, by = "b", merge_by_chunk_id = FALSE) %>% collect
+    })
+  expect_equal(nrow(ad50), 50)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(),"tmp_a_aj.df"))
+  fs::dir_delete(file.path(tempdir(),"tmp_b_aj.df"))
+  fs::dir_delete(file.path(tempdir(),"tmp_d_aj.df"))
+
+  fs::dir_delete(file.path(tempdir(),"tmp_a_aj2.df"))
+  fs::dir_delete(file.path(tempdir(),"tmp_b_aj2.df"))
+  fs::dir_delete(file.path(tempdir(),"tmp_d_aj2.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-as-data-frame.R b/tests/testthat/test-as-data-frame.R
new file mode 100644
index 00000000..0cb853fb
--- /dev/null
+++ b/tests/testthat/test-as-data-frame.R
@@ -0,0 +1,14 @@
+context("test-as-data-frame")
+
+test_that("as.data.frame works", {
+  tmpdir = tempfile("disk.frame.tmp")
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11, 100), tmpdir, overwrite = T)
+  dff = as.data.frame(df)
+  dft = data.table::as.data.table(df)
+  expect_s3_class(dff, "data.frame")
+  expect_s3_class(dft, "data.table")
+  expect_equal(nrow(dff), 1e5+11)
+  
+  delete(df)
+})
+
diff --git a/tests/testthat/test-as-disk-frame.R b/tests/testthat/test-as-disk-frame.R
new file mode 100644
index 00000000..b1ac42dc
--- /dev/null
+++ b/tests/testthat/test-as-disk-frame.R
@@ -0,0 +1,15 @@
+context("test-as-disk-frame")
+
+test_that("as.disk.frame works", {
+  ROWS = 1e5+11
+  
+  df = disk.frame:::gen_datatable_synthetic(ROWS)
+  tf = file.path(tempdir(), "tmp_as_disk_frame_delete")
+  
+  dfdf <- as.disk.frame(df, outdir = tf, overwrite=TRUE)
+  
+  expect_equal(nrow(dfdf), ROWS)
+  expect_error(dfdf <- as.disk.frame(df, tf, overwrite=FALSE))
+  
+  delete(dfdf)
+})
diff --git a/tests/testthat/test-bloom-filter.r b/tests/testthat/test-bloom-filter.r
new file mode 100644
index 00000000..9fa4ad42
--- /dev/null
+++ b/tests/testthat/test-bloom-filter.r
@@ -0,0 +1,16 @@
+# context("test-bloomfilter")
+# 
+# test_that("bloomfilter should fail here", {
+#   expect_error(make_bloomfilter(df, c("origin", "dest")))
+# })
+# 
+# test_that("bloomfilter should succeed", {
+#   df = nycflights13::flights %>% as.disk.frame(shardby = c("carrier"))
+#   make_bloomfilter(df, "carrier")
+#   expect_true(length(bf_likely_in_chunks(df, "carrier", "UA")) == 1)
+#   
+#   expect_equal(nrow(collect(use_bloom_filter(df, "carrier", "UA"))), nrow(filter(nycflights13::flights, carrier == "UA")))
+#   
+#   # clean up
+#   delete(df)
+# })
diff --git a/tests/testthat/test-collect.R b/tests/testthat/test-collect.R
new file mode 100644
index 00000000..b5a174c8
--- /dev/null
+++ b/tests/testthat/test-collect.R
@@ -0,0 +1,57 @@
+context("test-collect")
+
+setup({
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(),"tmp_col_delete"), overwrite=T)
+})
+
+test_that("collect works on simple data", {
+  df = disk.frame(file.path(tempdir(),"tmp_col_delete"))
+  dff = dplyr::collect(df)
+  expect_equal(nrow(dff), 1e5+11)
+  expect_s3_class(dff, "data.frame")
+  expect_s3_class(dff, "data.table")
+})
+
+test_that("collect works on lazy stream", {
+  df = disk.frame(file.path(tempdir(),"tmp_col_delete"))
+  df = cmap(df, lazy = T, ~{
+    .x[1:10, ]
+  })
+  dff = dplyr::collect(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_s3_class(dff, "data.frame")
+  expect_s3_class(dff, "data.table")
+})
+
+test_that("collect works on lazy stream followed by dplyr", {
+  df = disk.frame(file.path(tempdir(),"tmp_col_delete"))
+  df = cmap(df, lazy = T, ~{
+    .x[1:10, ]
+  }) %>% select(id1, id4)
+  
+  dff = dplyr::collect(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_equal(ncol(dff), 2)
+  expect_s3_class(dff, "data.frame")
+  expect_s3_class(dff, "data.table")
+})
+
+
+test_that("collect works on dplyr::select followed by lazy", {
+  df = disk.frame(file.path(tempdir(),"tmp_col_delete"))
+  df = df %>% select(id1, id4) %>%
+    cmap.disk.frame(lazy = T, ~{
+      .x[1:10, ]
+    })
+  
+  dff = dplyr::collect(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_equal(ncol(dff), 2)
+  expect_s3_class(dff, "data.frame")
+  expect_s3_class(dff, "data.table")
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(),"tmp_col_delete"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-compute.r b/tests/testthat/test-compute.r
new file mode 100644
index 00000000..3a1bd56e
--- /dev/null
+++ b/tests/testthat/test-compute.r
@@ -0,0 +1,55 @@
+context("test-compute")
+
+setup({
+  setup_disk.frame(workers = 2)
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(),"tmp_compute_delete"), overwrite=T)
+})
+
+test_that("compute works on simple data", {
+  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  dff = compute(df)
+  
+  expect_equal(nrow(dff), 1e5+11)
+  expect_s3_class(dff, "disk.frame")
+})
+
+test_that("compute works on lazy stream", {
+  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  df = cmap(df, lazy = T, ~{
+    .x[1:10, ]
+  })
+  dff = compute(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_s3_class(dff, "disk.frame")
+})
+
+test_that("compute works on lazy stream followed by dplyr", {
+  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  df = cmap(df, lazy = T, ~{
+    .x[1:10, ]
+  }) %>% select(id1, id4)
+  
+  dff = compute(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_equal(ncol(dff), 2)
+  expect_s3_class(dff, "disk.frame")
+})
+
+
+test_that("compute works on dplyr::select followed by lazy", {
+  df = disk.frame(file.path(tempdir(),"tmp_compute_delete"))
+  df = df %>% select(id1, id4) %>%
+    cmap(lazy = T, ~{
+      .x[1:10, ]
+    })
+  
+  dff = dplyr::collect(df)
+  expect_equal(nrow(dff), nchunks(df)*10)
+  expect_equal(ncol(dff), 2)
+  expect_s3_class(dff, "data.frame")
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(),"tmp_compute_delete"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-csv2disk.frame.r b/tests/testthat/test-csv2disk.frame.r
new file mode 100644
index 00000000..dcc73652
--- /dev/null
+++ b/tests/testthat/test-csv2disk.frame.r
@@ -0,0 +1,84 @@
+context("test-csv2disk.frame")
+
+setup({
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_csv2df.csv"))
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_csv2df2.csv"))
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_csv2df3.csv"))
+})
+
+test_that("csv2disk.frame works with no shard", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_csv2df.csv"),
+    file.path(tempdir(), "tmp_pls_delete_csv2df.df"), 
+    overwrite=TRUE, 
+    nchunks=max(2, recommend_nchunks(file.size(file.path(tempdir(), "tmp_pls_delete_csv2df.csv")))))
+  dff1 = dff[,sum(v1), id1]
+  dff2 = dff1[,sum(V1), id1]
+  expect_false(nrow(dff1) == nrow(dff2))
+  expect_equal(nrow(dff), 1e3+11)
+  expect_equal(ncol(dff), 10)
+})
+
+test_that("csv2disk.frame works with shard", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_csv2df2.csv"),
+    file.path(tempdir(), "tmp_pls_delete_csv2df2.df"), 
+    shardby = "id1", overwrite = TRUE)
+  dff1 = dff[,sum(v1), id1]
+  dff2 = dff1[,sum(V1), id1]
+  expect_true(nrow(dff1) == nrow(dff2))
+  expect_equal(nrow(dff), 1e3+11)
+  expect_equal(ncol(dff), 10)
+  
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_csv2df3.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_csv2df3.df"), 
+    shardby = c("id1","id2"))
+  
+  dff1 = dff[,sum(v1), .(id1,id2)]
+  dff2 = dff1[,sum(V1), .(id1,id2)]
+  expect_true(nrow(dff1) == nrow(dff2))
+  expect_equal(nrow(dff), 1e3+11)
+  expect_equal(ncol(dff), 10)
+})
+
+test_that("csv2disk.frame tests readr", {
+  library(dplyr)
+  library(disk.frame)
+  library(data.table)
+  library(nycflights13)
+  
+  expect_equal(1,1)
+  
+  # TODO make this test better
+  # convert from a data frame
+  # flights <- flights %>%
+  #   dplyr::mutate(date = as.Date(paste(year, month, day, sep = "-")))
+  # str(flights) # time_hour is POSIXct
+  # 
+  # flights.df <- as.disk.frame(
+  #   flights,
+  #   outdir = file.path(tempdir(), "tmp_flights.df"),
+  #   overwrite = TRUE)
+  # flights.df
+  # str(collect(flights.df)) 
+  # 
+  # # with sharding
+  # df_path = file.path(tempdir(), "tmp_flights.df")
+  # flights.df <- csv_to_disk.frame(
+  #   csv_path,
+  #   outdir = df_path,
+  #   shardby = "minute",
+  #   overwrite = T,
+  #   backend = "readr")
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_csv2df.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_csv2df2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_csv2df3.df"))
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_csv2df.csv"))
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_csv2df2.csv"))
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_csv2df3.csv"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-data-table.r b/tests/testthat/test-data-table.r
new file mode 100644
index 00000000..0275ee4a
--- /dev/null
+++ b/tests/testthat/test-data-table.r
@@ -0,0 +1,41 @@
+context("test-data.table [")
+
+setup({
+  library(data.table)
+  setup_disk.frame(workers = 2)
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(), "tmp_col_delete"), overwrite=TRUE, nchunks = 8)
+})
+
+test_that("data.table .N", {
+  library(data.table)
+  df = disk.frame(file.path(tempdir(), "tmp_col_delete"))
+  res <- sum(unlist(df[,.N]))
+  expect_equal(res , 1e5+11)
+})
+
+test_that("data.table .N+y V1", {
+  df = disk.frame(file.path(tempdir(), "tmp_col_delete"))
+  if(interactive()) {
+    y = 2
+    
+    {y = 3; a <- df[,.(n_plus_y = .N + y), v1]}
+    b <- df[,.N, v1]
+    
+    expect_equal(a$n_plus_y, b$N + y)
+  } else {
+    # TODO figure out why the above fails
+    expect_equal(2L, 2L)
+  }
+})
+
+test_that("data.table do not return a data.table", {
+  library(data.table)
+  df = disk.frame(file.path(tempdir(), "tmp_col_delete"))
+  res <- df[,.(.N), rbind=FALSE]
+  expect_equal(typeof(res), "list")
+  expect_equal(length(res), 8)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_col_delete"))
+})
diff --git a/tests/testthat/test-delete.r b/tests/testthat/test-delete.r
new file mode 100644
index 00000000..cc13cce8
--- /dev/null
+++ b/tests/testthat/test-delete.r
@@ -0,0 +1,20 @@
+context("test-delete")
+
+setup({
+  setup_disk.frame(workers = 2)
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(), "tmp_del_delete"), overwrite = TRUE)
+})
+
+test_that("data.table .N", {
+  df = disk.frame(file.path(tempdir(), "tmp_del_delete"))
+  p = attr(df, "path", exact=TRUE)
+  expect_true(fs::dir_exists(p))
+  
+  delete(df)
+  
+  expect_false(fs::dir_exists(p))
+})
+
+teardown({
+  #fs::dir_delete("tmp_del_delete")
+})
\ No newline at end of file
diff --git a/tests/testthat/test-disk-frame.r b/tests/testthat/test-disk-frame.r
new file mode 100644
index 00000000..236e7a18
--- /dev/null
+++ b/tests/testthat/test-disk-frame.r
@@ -0,0 +1,34 @@
+context("test-disk.frame")
+
+# TODO add in tests here
+
+test_that("test add_meta", {
+  # it works so how to test this?
+  expect_equal(2L, 2L)
+  
+})
+
+test_that("test head", {
+  # it works so how to test this?
+  expect_equal(2L, 2L)
+  
+})
+
+test_that("test tail", {
+  # it works so how to test this?
+  expect_equal(2L, 2L)
+  
+})
+
+
+test_that("test nrow", {
+  # it works so how to test this?
+  
+  expect_equal(2L, 2L)
+})
+
+test_that("test ncol", {
+  # it works so how to test this?
+  
+  expect_equal(2L, 2L)
+})
\ No newline at end of file
diff --git a/tests/testthat/test-dplyr-verbs.r b/tests/testthat/test-dplyr-verbs.r
new file mode 100644
index 00000000..f8f18f35
--- /dev/null
+++ b/tests/testthat/test-dplyr-verbs.r
@@ -0,0 +1,175 @@
+context("test-dplyr-verbs")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_dv.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing select", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  df = b %>% 
+    select(a) %>% 
+    collect
+  
+  expect_equal(ncol(df), 1)
+})
+
+test_that("testing rename", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  df = b %>% 
+    rename(a_new_name = a) %>% 
+    collect
+  
+  expect_setequal(colnames(df), c("a_new_name", "b"))
+})
+
+test_that("testing filter", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  df = b %>% 
+    filter(a <= 100, b <= 10) %>% 
+    collect
+  
+  expect_setequal(nrow(df), 10)
+})
+
+test_that("testing filter - global vars", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  one_hundred = 100
+  
+  df = b %>% 
+    filter(a <= one_hundred, b <= 10) %>% 
+    collect
+  
+  expect_setequal(nrow(df), 10)
+})
+
+test_that("testing mutate", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  
+  df = b %>% 
+    mutate(d = a + b) %>% 
+    collect
+  
+  expect_setequal(sum(df$d), sum(df$a, df$b))
+  
+  df = b %>% 
+    mutate(e = rank(desc(a))) %>%
+    collect
+  
+  expect_equal(nrow(df), 100)
+  
+  # need to test
+  value <- as.disk.frame(tibble(char = LETTERS,
+                                num = 1:26))
+  df2 = value %>%
+    dplyr::mutate(b =  case_when(
+      char %in% c("A", "B", "C") ~ "1",
+      TRUE ~ char)) %>% 
+    collect
+  
+  expect_equal(ncol(df2), 3)
+  
+  # testing
+  fn = function(a, b) {
+    a+b
+  }
+  
+  df3 = value %>%
+    dplyr::mutate(b =  fn(num, num)) %>%
+    collect
+  
+  expect_equal(ncol(df3), 3)
+  
+  
+  global_var = 100
+  
+  df4 = value %>%
+    dplyr::mutate(b =  fn(num, num), d = global_var*2) %>%
+    collect
+  
+  expect_equal(ncol(df4), 4)
+  expect_true(all(df4$d == 200))
+})
+
+test_that("testing mutate user-defined function", {
+   b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+   
+   
+   udf = function(a1, b1) {
+     a1 + b1
+   }
+   
+   df = b %>%
+     mutate(d = udf(a,b)) %>%
+     collect
+   
+   expect_setequal(sum(df$d), sum(df$a, df$b))
+})
+
+test_that("testing transmute", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  df = b %>% 
+    transmute(d = a + b) %>% 
+    collect
+  
+  expect_setequal(names(df), c("d"))
+})
+
+test_that("testing arrange", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  expect_warning(df <- b %>%
+    mutate(random_unif = runif(dplyr::n())) %>% 
+    arrange(desc(random_unif)))
+  
+  df <- b %>%
+    mutate(random_unif = runif(dplyr::n())) %>% 
+    chunk_arrange(desc(random_unif))
+  
+  x = purrr::map_lgl(1:nchunks(df), ~{
+    is.unsorted(.x) == FALSE
+  })
+  
+  expect_true(all(x))
+})
+
+test_that("testing chunk_summarise", {
+  b = disk.frame(file.path(tempdir(), "tmp_b_dv.df"))
+  
+  df = b %>%
+    chunk_summarise(suma = sum(a)) %>% 
+    collect %>% 
+    summarise(suma = sum(suma))
+  
+  expect_equal(df$suma, collect(b)$a %>% sum)
+})
+
+test_that("testing mutate within function works", {
+  test_f <- function(params, x_df){
+    x_df %>% mutate(aha = params[1]*cyl + params[2]*disp)
+  }
+  
+  expect_true("aha" %in% names(test_f(c(1, 2), mtcars)))
+})
+
+test_that("filter failure: prevent github #191 regression",  {
+  flights_df = as.disk.frame(nycflights13::flights)
+  
+  # expect error due to syntax error
+  expect_warning(expect_error(flights_df %>% 
+    filter(tailnum %in% paste0(unique(nycflights13::flights$tailnum)[1:60]), "") %>% 
+    collect))
+  
+  delete(flights_df)
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_b_dv.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-dtplyr-support.r b/tests/testthat/test-dtplyr-support.r
new file mode 100644
index 00000000..a3499435
--- /dev/null
+++ b/tests/testthat/test-dtplyr-support.r
@@ -0,0 +1,46 @@
+context("test-dtplyr-verbs")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  tf = file.path(tempdir(), "test-dtplyr.df")
+  as.disk.frame(b, outdir = tf, nchunks = 5, overwrite = TRUE)
+})
+
+test_that("testing dtplyr", {
+  # TODO add tests when new version of dtplyr on CRAN
+  # iris_df = as.disk.frame(iris)
+  # 
+  # iris_df %>% 
+  #   filter(Sepal.Length > 7) %>% 
+  #   collect()
+  # 
+  # 
+  # aa = iris_df %>% 
+  #   cmap(~{
+  #     dtplyr::lazy_dt(.x) %>% 
+  #       filter(Sepal.Length > 7) %>% 
+  #       collect()
+  #   }) %>% 
+  #   collect
+  # 
+  # 
+  # lazy_dt <- function(...) {
+  #   UseMethod("lazy_dt")
+  # }
+  # 
+  # lazy_dt.disk.frame <- function(df, ...) {
+  #   cmap(df, )
+  # }
+  # 
+  # lazy_dt.default <- function(...) {
+  #   dtplyr::lazy_dt(...)
+  # }
+  expect_true(TRUE)
+})
+
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "test-dtplyr.df"))
+})
+
diff --git a/tests/testthat/test-foverlaps.r b/tests/testthat/test-foverlaps.r
new file mode 100644
index 00000000..a4438aa0
--- /dev/null
+++ b/tests/testthat/test-foverlaps.r
@@ -0,0 +1,42 @@
+context("test-foverlaps")
+
+setup({
+  #setup_disk.frame(workers = 1)
+})
+
+# TODO currently it's not possible to do 
+test_that("test foverlap with data.frame", {
+  x = as.disk.frame(data.table(start=c(5,31,22,16), end=c(8,50,25,18), val2 = 7:10))
+  y = as.disk.frame(data.table(start=c(10, 20, 30), end=c(15, 35, 45), val1 = 1:3))
+  byxy = c("start", "end")
+  xy.df = foverlaps.disk.frame(
+    x, y, by.x = byxy, by.y = byxy,
+    merge_by_chunk_id = TRUE, overwrite = TRUE)
+  
+  collect(xy.df)
+  
+  testthat::expect_equal(nrow(xy.df), 3)
+})
+  
+
+# TODO this is also not a good test case
+# test_that("test foverlap with disk.frame", {  
+#   x = data.table(start=c(5,31,22,16), end=c(8,50,25,18), val2 = 7:10)
+#   y = data.table(start=c(10, 20, 30), end=c(15, 35, 45), val1 = 1:3)
+#   setkey(y, start, end)
+#   
+#   dx = shard(x, "tmp_fo.df", overwrite = T, shardby=c("start","end"))
+#   dy = shard(y, "tmp_to.df", overwrite = T, shardby=c("start","end"))
+#   
+#   xy1 = foverlaps(x,y, type="any", which = T)
+#   
+#   dxy1 = foverlaps.disk.frame(dx, dy, type="any", outdir="tmp_fo_out2.df") ## return overlap join
+#   dxy1c = dxy1 %>% collect
+#   
+#   foverlaps.disk.frame(dx, dy, type="any", mult="first", outdir="tmp_fo_out2.df") ## returns only first match
+#   foverlaps.disk.frame(dx, dy, type="within", outdir="tmp_fo_out3.df") ## matches iff 'x' is within 'y'
+# })
+
+teardown({
+  
+})
\ No newline at end of file
diff --git a/tests/testthat/test-full_join.R b/tests/testthat/test-full_join.R
new file mode 100644
index 00000000..f40e8cb8
--- /dev/null
+++ b/tests/testthat/test-full_join.R
@@ -0,0 +1,58 @@
+context("test-full_join")
+
+setup({
+  a = data.frame(a = 1:100, b = 1:100)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_fj.df"), nchunks = 4, overwrite = T)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_fj.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_fj.df"), overwrite = T)
+})
+
+test_that("testing full_join where right is data.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_fj.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_fj.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_fj.df"))
+  bc = collect(b)
+  dc = collect(d)
+  
+  abc <- full_join(a, bc, by = "a") %>% collect
+  expect_equal(nrow(abc), 150)
+  
+  abc0 <- full_join(a, bc, by = c("a","b")) %>% collect
+  expect_equal(nrow(abc0), 200)
+  
+  abc100 <- full_join(a, bc, by = "b") %>% collect
+  expect_equal(nrow(abc100), 100)
+  
+  abd50 <- full_join(a, dc, by = "b") %>% collect
+  expect_equal(nrow(abd50), 100)
+})
+
+test_that("testing full_join where right is disk.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_fj.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_fj.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_fj.df"))
+  
+  expect_warning({
+    ab <- full_join(a, b, by = "a", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab), 150)
+  
+  expect_warning({ab0 = full_join(a, b, by = c("a","b"), merge_by_chunk_id = F) %>% collect})
+  expect_equal(nrow(ab0), 200)
+  
+  expect_warning({ab100 = full_join(a, b, by = "b", merge_by_chunk_id = F) %>% collect})
+  expect_equal(nrow(ab100), 100)
+  
+  expect_warning({ad50 = full_join(a, d, by = "b", merge_by_chunk_id = F) %>% collect})
+  expect_equal(nrow(ad50), 100)
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_a_fj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_fj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_fj.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-get_chunk.r b/tests/testthat/test-get_chunk.r
new file mode 100644
index 00000000..d33c336e
--- /dev/null
+++ b/tests/testthat/test-get_chunk.r
@@ -0,0 +1,17 @@
+context("test-get_chunk")
+
+setup({
+  #setup_disk.frame(workers = 1)
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(), "tmp_del_delete"), overwrite=T)
+})
+
+test_that("data.table .N", {
+  df = disk.frame(file.path(tempdir(), "tmp_del_delete"))
+  expect_s3_class(get_chunk(df, 1), "data.frame")
+
+  expect_s3_class(get_chunk(df, "1.fst"), "data.frame")
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_del_delete"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-get_chunk_ids.r b/tests/testthat/test-get_chunk_ids.r
new file mode 100644
index 00000000..5e95c701
--- /dev/null
+++ b/tests/testthat/test-get_chunk_ids.r
@@ -0,0 +1,20 @@
+context("test-get_chunk_ids")
+
+setup({
+  #setup_disk.frame(workers = 1)
+  df = as.disk.frame(disk.frame:::gen_datatable_synthetic(1e5+11), file.path(tempdir(), "tmp_del_delete"), overwrite=T)
+})
+
+test_that("get_chunk_ids", {
+  df = disk.frame(file.path(tempdir(), "tmp_del_delete"))
+  
+  gci = get_chunk_ids(df)
+  expect_type(get_chunk_ids(df), "character")
+
+  gcis = get_chunk_ids(df, strip_extension = F)
+  expect_true("1.fst" %in% gcis)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_del_delete"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-glm.r b/tests/testthat/test-glm.r
new file mode 100644
index 00000000..efa0122a
--- /dev/null
+++ b/tests/testthat/test-glm.r
@@ -0,0 +1,30 @@
+context("test-glm")
+
+setup({
+  #setup_disk.frame(workers = 1)
+})
+
+test_that("glm", {
+  cars.df = as.disk.frame(cars, outdir = file.path(tempdir(), "cars.df"), overwrite = TRUE)
+  
+  majorv = as.integer(version$major)
+  minorv = as.integer(strsplit(version$minor, ".", fixed=TRUE)[[1]][1])
+  
+  if((majorv == 3) & (minorv < 6)) {
+    expect_warning({m <- dfglm(dist~speed, cars.df, glm_backend = "biglm")})
+  } else {
+    m <- dfglm(dist~speed, cars.df, glm_backend = "biglm")
+  }
+  summary(m)
+  
+  if((majorv == 3) & (minorv >= 6) ) {
+    broom::tidy(m)
+  }
+  
+  m <- dfglm(dist~speed, cars.df, glm_backend = "speedglm")
+  summary(m)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "cars.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-group-by.R b/tests/testthat/test-group-by.R
new file mode 100644
index 00000000..d6684114
--- /dev/null
+++ b/tests/testthat/test-group-by.R
@@ -0,0 +1,309 @@
+context("test-group_by")
+
+setup({
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+})
+
+
+test_that("new group_by framework", {
+  if(interactive()) {
+    iris.df = iris %>% 
+      as.disk.frame
+    
+    grpby = iris.df %>% 
+        group_by(Species) %>% 
+        summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
+        collect
+    
+    grpby2 = iris %>% 
+      group_by(Species) %>% 
+      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
+      arrange()
+    
+    for (n in names(grpby)) {
+      expect_true(all(grpby2[, n] == grpby[, n]) || all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
+    }
+    
+    delete(iris.df)
+  }
+  expect_true(TRUE)
+})
+
+test_that("new group_by framework - no group-by just summarise", {
+  if(interactive()) {
+    iris.df = iris %>% 
+      as.disk.frame
+    
+    grpby = iris.df %>% 
+      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
+      collect
+    
+    grpby2 = iris %>% 
+      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
+      arrange()
+    
+    for (n in names(grpby)) {
+      expect_true(all(grpby2[, n] == grpby[, n]) || all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
+    }
+    
+    delete(iris.df)
+  }
+  expect_true(TRUE)
+})
+
+# test_that("new group_by framework - nested-group-by", {
+  # if(interactive()) {
+  #   iris.df = iris %>% 
+  #     as.disk.frame
+  #   
+  #   expect_error(grpby <- iris.df %>% 
+  #     summarize(mean(Petal.Length + max(Petal.Length))) %>% 
+  #     collect)
+  #   
+  #   expect_error(grpby <- iris.df %>% 
+  #     summarize(mean(Petal.Length) + max(Petal.Length)) %>% 
+  #     collect)
+  #   
+  #   expect_error(grpby <- iris.df %>% 
+  #     summarize(mean(Petal.Length) + 1) %>% 
+  #     collect)
+  #   
+  #   expect_error(grpby <- iris.df %>% 
+  #     summarize(list(mean(Petal.Length))) %>% 
+  #     collect)
+  #   
+  #   fn_tmp = function(x) x + 1
+  #   grpby <- iris.df %>% 
+  #       summarize(mean(fn_tmp(Petal.Length))) %>% 
+  #       collect
+  #   
+  #   grpby2 <- iris %>% 
+  #     summarize(mean(fn_tmp(Petal.Length)))
+  #   
+  #   for (n in names(grpby)) {
+  #     expect_true(all(grpby2[, n] == grpby[, n]) || all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
+  #   }
+  #   delete(iris.df)
+  # }
+  # expect_true(TRUE)
+# })
+
+test_that("guard against github #241", {
+  if(interactive()) {
+    # I suspect there was an issue with number of chunk = 1
+    result_from_disk.frame = iris %>%
+      as.disk.frame(nchunks = 1) %>%
+      group_by(Species) %>%
+      summarize(
+        mean(Petal.Length),
+        sumx = sum(Petal.Length/Sepal.Width),
+        sd(Sepal.Width/ Petal.Length),
+        var(Sepal.Width/ Sepal.Width),
+        l = length(Sepal.Width/ Sepal.Width + 2),
+        max(Sepal.Width),
+        min(Sepal.Width),
+        median(Sepal.Width)
+      ) %>%
+      collect
+  } else {
+    expect_true(TRUE)
+  }
+})
+
+
+test_that("group_by", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  
+  dff_res = dff %>% 
+    collect %>% 
+    group_by(id1) %>% 
+    summarise(mv1 = mean(v1))
+  
+  dff1 <- dff %>% 
+    chunk_group_by(id1, id2) %>%
+    chunk_summarise(mv1 = mean(v1)) %>% 
+    collect
+
+  expect_false(nrow(dff1) == nrow(dff_res))
+})
+
+test_that("test hard_group_by on disk.frame", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  
+  dff_res = dff %>% 
+    collect %>% 
+    group_by(id1, id2) %>% 
+    summarise(mv1 = mean(v1))
+  
+  dff1 <- dff %>% 
+      hard_group_by(id1, id2) %>%
+      chunk_summarise(mv1 = mean(v1)) %>% collect
+  
+  expect_equal(nrow(dff1), nrow(dff_res))
+})
+
+test_that("test hard_group_by on data.frame", {
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  
+  df1 = df %>% 
+    group_by(id1, id2) %>% 
+    summarise(mv1 = mean(v1))
+  
+  dff1 <- df %>% 
+    hard_group_by(id1,id2) %>%
+    summarise(mv1 = mean(v1))
+  
+  expect_equal(nrow(dff1), nrow(df1))
+})
+
+
+test_that("test hard_group_by on disk.frame (sort)", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  
+  dff_res = dff %>% 
+    collect %>% 
+    group_by(id1, id2) %>% 
+    summarise(mv1 = mean(v1))
+  
+  dff1 <- dff %>% 
+    hard_group_by(id1, id2, shardby_function="sort") %>%
+    chunk_summarise(mv1 = mean(v1)) %>% collect
+  
+  expect_equal(nrow(dff1), nrow(dff_res))
+})
+
+test_that("test hard_group_by on data.frame (sort)", {
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  
+  df1 = df %>% 
+    group_by(id1, id2) %>% 
+    summarise(mv1 = mean(v1))
+  
+  dff1 <- df %>% 
+    hard_group_by(id1, id2, shardby_function="sort") %>%
+    summarise(mv1 = mean(v1))
+  
+  expect_equal(nrow(dff1), nrow(df1))
+})
+
+test_that("guard against github 256", {
+  test2 <- tibble::tibble(
+    date = lubridate::ymd(rep(c("2019-01-02", "2019-02-03", "2019-03-04"), 4)),
+    uid = as.factor(rep(c(uuid::UUIDgenerate(), uuid::UUIDgenerate()), 6)),
+    proto = as.factor(rep(c("TCP", "UDP", "ICMP"), 4)),
+    port = as.double(rep(c(22, 21, 0), 4))
+  )
+  
+  correct_result = test2 %>%
+    group_by(date, uid, proto, port) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  test_df = as.disk.frame(test2, nchunks = 2, overwrite=TRUE)
+  
+  incorrect_result = test_df %>%
+    group_by(date, uid, proto, port) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  expect_equal(dim(incorrect_result), dim(correct_result))
+})
+
+test_that("guard against github 256 #2", {
+  test2 <- tibble::tibble(
+    date = lubridate::ymd(rep(c("2019-01-02", "2019-02-03", "2019-03-04"), 4)),
+    uid = as.factor(rep(c(uuid::UUIDgenerate(), uuid::UUIDgenerate()), 6)),
+    proto = as.factor(rep(c("TCP", "UDP", "ICMP"), 4)),
+    port = as.double(rep(c(22, 21, 0), 4))
+  )
+  
+  test_df = as.disk.frame(test2, nchunks = 2, overwrite=TRUE)
+  
+  
+  correct_result = test_df %>%
+    group_by(!!!syms(names(test_df))) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  incorrect_result = test_df %>%
+    group_by(date, uid, proto, port) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  expect_equal(dim(incorrect_result), dim(correct_result))
+})
+
+test_that("guard against github 256 #3", {
+  library(testthat)
+  library(disk.frame)
+  setup_disk.frame()
+  
+  test2 <- tibble::tibble(
+    date = sample(1:10, 20, replace = TRUE),
+    uid = sample(1:10, 20, replace = TRUE)
+  )
+  
+  test_df = as.disk.frame(test2, nchunks = 2, overwrite=TRUE)
+  
+  ntd = names(test_df)
+  
+  correct_result = test_df %>%
+    group_by(!!!syms(ntd)) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  incorrect_result = test_df %>%
+    group_by(date, uid) %>%
+    summarize(n=n()) %>% 
+    collect
+  
+  expect_equal(dim(incorrect_result), dim(correct_result))
+})
+
+test_that("tests for github #250", {
+  aggregate_expressions <- list(n = quote(n()))
+  
+  result1 = iris %>% 
+    as.disk.frame() %>% 
+    group_by(Species) %>%
+    summarise(n = n()) %>% 
+    collect
+  
+  result2 <- iris %>% 
+    as.disk.frame() %>% 
+    group_by(Species) %>%
+    summarize(!!!(aggregate_expressions)) %>% 
+    collect
+  
+  expect_equal(result1, result2)
+})
+
+test_that("tests for github #250 2", {
+  aggregate_expressions <- list(n = quote(n()), quote(n()))
+  
+  result1 = iris %>% 
+    as.disk.frame() %>% 
+    group_by(Species) %>%
+    summarise(n = n(), n()) %>% 
+    collect; result1
+  
+  result2 <- iris %>% 
+    as.disk.frame() %>% 
+    group_by(Species) %>%
+    summarize(!!!(aggregate_expressions)) %>% 
+    collect
+  
+  expect_equal(result1, result2)
+})
+
+teardown({
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
+})
diff --git a/tests/testthat/test-hard-arrange.R b/tests/testthat/test-hard-arrange.R
new file mode 100644
index 00000000..0419cee8
--- /dev/null
+++ b/tests/testthat/test-hard-arrange.R
@@ -0,0 +1,111 @@
+context("test-arrange")
+
+setup({
+  
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+})
+
+test_that("test hard_arrange on disk.frame, single chunk", {
+  # Randomise rows since rows are already sorted
+  iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 1)
+  iris_hard.df = hard_arrange(iris.df, Species)
+  
+  # Check sort
+  expect_true(!is.unsorted(iris_hard.df$Species))
+})
+
+test_that("test hard_arrange on disk.frame, single variable", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  
+  # Sort ascending, one level
+  sorted_dff <- dff %>% hard_arrange(id1)
+  sorted_df <- sorted_dff %>% collect
+  
+  expect_true(!is.unsorted(sorted_df$id1))
+})
+
+test_that("test hard_arrange on disk.frame, factor data type", {
+  iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 2)
+  iris_hard.df = hard_arrange(iris.df, Species)
+
+  expect_true(!is.unsorted(iris_hard.df$Species))  
+})
+
+test_that("test hard_arrange on disk.frame, date data type", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  sorted_dff <- dff %>% hard_arrange(date1)
+  
+  expect_true(!is.unsorted(sorted_dff$date1))    
+})
+
+test_that("test hard_arrange on disk.frame, two and three variables", {   
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  
+  dfp <- read.csv(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+  
+  # Sort ascending, two levels
+  sorted_dff <- dff %>% hard_arrange(id1, id4) %>% collect
+  sorted_dfp <- dff %>% collect %>% dplyr::arrange(id1, id4) 
+  
+  # Compare vs dplyr
+  expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
+  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+  
+  # Sort ascending, three levels, from already partially sorted disk frame
+  sorted_dff2 <- sorted_dff %>% hard_arrange(id1, id4, id6) %>% collect
+  sorted_dfp2 <- dff %>% collect %>% dplyr::arrange(id1, id4, id6) 
+  
+  # Compare vs dplyr
+  expect_true(all(sorted_dff2$id1 == sorted_dfp2$id1))
+  expect_true(all(sorted_dff2$id4 == sorted_dfp2$id4))
+  expect_true(all(sorted_dff2$id6 == sorted_dfp2$id6))  
+})
+
+test_that("test hard_arrange on disk.frame, two factors", { 
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+    file.path(tempdir(), "tmp_pls_delete_gb.df"))
+    
+  # Sort decending, two levels
+  desc_dff <- dff %>% hard_arrange(desc(id4), id2)
+  desc_dff <- desc_dff %>% collect
+  
+  #  Level 1
+  expect_true(!is.unsorted(-desc_dff$id4))
+  
+  #  Level 2
+  desc_dff$id4_id2 <- paste0(
+    formatC(max(desc_dff$id4) - desc_dff$id4, width=3, format="d", flag= "0"), 
+    desc_dff$id2)
+  expect_true(!is.unsorted(-desc_dff$id4))
+})
+
+test_that("test hard_arrange on data.frame vs dplyr", {
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  
+  # Sort ascending
+  sorted_dff <- df %>% hard_arrange(id1, id4) %>% collect
+  sorted_dfp <- df %>% dplyr::arrange(id1, id4)
+  
+  expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
+  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+  
+  # Sort decending
+  desc_dff <- df %>% hard_arrange(desc(id4), id2) %>% collect
+  desc_dfp <- df %>% dplyr::arrange(desc(id4), id2) 
+  
+  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+  expect_true(all(sorted_dff$id2 == sorted_dfp$dfp))  
+})
+
+teardown({
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-inner_join.R b/tests/testthat/test-inner_join.R
new file mode 100644
index 00000000..e165a142
--- /dev/null
+++ b/tests/testthat/test-inner_join.R
@@ -0,0 +1,64 @@
+context("test-inner_join")
+
+setup({
+  a = data.frame(a = 1:100, b = 1:100)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_ij.df"), nchunks = 4, overwrite = T)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_ij.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_ij.df"), overwrite = T)
+
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_ij2.df"), nchunks = 4, overwrite = T)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_ij2.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_ij2.df"), overwrite = T)
+})
+
+test_that("testing inner_join where right is data.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_ij.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_ij.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_ij.df"))
+  bc = collect(b)
+  dc = collect(d)
+  
+  abc = inner_join(a, bc, by = "a") %>% collect
+  expect_equal(nrow(abc), 50)
+  
+  abc0 = inner_join(a, bc, by = c("a","b")) %>% collect
+  expect_equal(nrow(abc0), 0)
+  
+  abc100 = inner_join(a, bc, by = "b") %>% collect
+  expect_equal(nrow(abc100), 100)
+  
+  abd50 = inner_join(a, dc, by = "b") %>% collect
+  expect_equal(nrow(abd50), 50)
+})
+
+test_that("testing inner_join where right is disk.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_ij2.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_ij2.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_ij2.df"))
+  
+  ab = inner_join(a, b, by = "a", merge_by_chunk_id = F) %>% collect
+  expect_equal(nrow(ab), 50)
+  
+  # expecting a warning for some chunks being 0 rows
+  expect_warning(ab0 <- inner_join(a, b, by = c("a","b"), merge_by_chunk_id = F) %>% collect)
+  expect_equal(nrow(ab0), 0)
+  
+  ab100 = inner_join(a, b, by = "b", merge_by_chunk_id = F) %>% collect
+  expect_equal(nrow(ab100), 100)
+  
+  ad50 = inner_join(a, d, by = "b", merge_by_chunk_id = F) %>% collect
+  expect_equal(nrow(ad50), 50)
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_a_ij.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_ij.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_ij.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_a_ij2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_ij2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_ij2.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-is-disk.frame.r b/tests/testthat/test-is-disk.frame.r
new file mode 100644
index 00000000..87d4fde4
--- /dev/null
+++ b/tests/testthat/test-is-disk.frame.r
@@ -0,0 +1,12 @@
+context("test-is-disk-frame")
+
+test_that("testing is_disk.frame", {
+  fs::dir_create(file.path(tempdir(), "tmp_is_disk_frame"))
+  fst::write_fst(data.frame(a= 1, b = 1), file.path(tempdir(), "tmp_is_disk_frame/1.fst"))
+  fst::write_fst(data.frame(a= 1, b = 1), file.path(tempdir(), "tmp_is_disk_frame/2.fst"))
+  
+  df = disk.frame(file.path(tempdir(), "tmp_is_disk_frame"))
+  expect_true(is_disk.frame(df))
+  
+  disk.frame::delete(df)
+})
diff --git a/tests/testthat/test-left_join.R b/tests/testthat/test-left_join.R
new file mode 100644
index 00000000..66801085
--- /dev/null
+++ b/tests/testthat/test-left_join.R
@@ -0,0 +1,71 @@
+context("test-left_join")
+
+setup({
+  
+  a = data.frame(a = 1:100, b = 1:100)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_lj.df"), nchunks = 4, overwrite = T)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_lj.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_lj.df"), overwrite = T)
+
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_lj2.df"), nchunks = 4, overwrite = T)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_lj2.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_lj2.df"), overwrite = T)
+})
+
+test_that("testing left_join where right is data.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_lj.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_lj.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_lj.df"))
+  bc = collect(b)
+  dc = collect(d)
+  
+  abc = left_join(a, bc, by = "a") %>% collect
+  expect_equal(nrow(abc), 100)
+  
+  abc0 = left_join(a, bc, by = c("a","b")) %>% collect
+  expect_equal(nrow(abc0), 100)
+  
+  abc100 = left_join(a, bc, by = "b") %>% collect
+  expect_equal(nrow(abc100), 100)
+  
+  abd50 = left_join(a, dc, by = "b") %>% collect
+  expect_equal(nrow(abd50), 100)
+})
+
+test_that("testing left_join where right is disk.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_lj2.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_lj2.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_lj2.df"))
+  
+  expect_warning({
+    ab = left_join(a, b, by = "a", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab), 100)
+  
+  expect_warning({
+    ab0 = left_join(a, b, by = c("a","b"), merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab0), 100)
+  
+  expect_warning({
+    ab100 = left_join(a, b, by = "b", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab100), 100)
+  
+  expect_warning({
+    ad50 = left_join(a, d, by = "b", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ad50), 100)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_a_lj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_lj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_lj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_a_lj2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_lj2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_lj2.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-map.r b/tests/testthat/test-map.r
new file mode 100644
index 00000000..beec44ba
--- /dev/null
+++ b/tests/testthat/test-map.r
@@ -0,0 +1,76 @@
+context("test-cmap")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_map.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing cmap lazy", {
+  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+  
+  # return 1 row from each chunk
+  df = b %>% cmap(~.x[1])
+  
+  expect_s3_class(df, "disk.frame")
+  
+  df2 = df %>% collect
+  
+  expect_s3_class(df2, "data.frame")
+  
+  expect_equal(nrow(df2), 5L)
+})
+
+test_that("testing cmap eager", {
+  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+  
+  # return 1 row from each chunk
+  df = b %>% cmap(~.x[1], lazy = F)
+  expect_false("disk.frame" %in% class(df))
+
+  # return 1 row from each chunk
+  df = b %>% cmap_dfr(~.x[1])
+  expect_false("disk.frame" %in% class(df))
+  expect_true("data.frame" %in% class(df))
+})
+
+test_that("testing delayed", {
+  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+  
+  # return 1 row from each chunk
+  df = b %>% delayed(~.x[1])
+  
+  expect_s3_class(df, "disk.frame")
+  
+  df1 = collect(df)
+  
+  expect_equal(nrow(df1), 5)
+})
+
+
+test_that("testing map_dfr", {
+  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+  
+  # return 1 row from each chunk
+  df = b %>% cmap_dfr(~.x[1,])
+  
+  expect_s3_class(df, "data.frame")
+})
+
+
+test_that("testing imap", {
+  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+  
+  # return 1 row from each chunk
+  df = b %>% cimap_dfr(~{
+    y = .x[1,]
+    y[,ok := .y]
+    y
+    })
+  
+  expect_s3_class(df, "data.frame")
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_map.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-map2.r b/tests/testthat/test-map2.r
new file mode 100644
index 00000000..926d49ee
--- /dev/null
+++ b/tests/testthat/test-map2.r
@@ -0,0 +1,46 @@
+context("test-cmap2")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 151:250, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_map2.df"), nchunks = 5, overwrite = T)
+  as.disk.frame(d, file.path(tempdir(), "tmp_map2d.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing cmap2 .y is disk.frame", {
+  b = disk.frame(file.path(tempdir(), "tmp_map2.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_map2d.df"))
+  
+  # return 1 row from each chunk
+  df = cmap2(b, d, ~rbindlist(list(.x[1,],.y[1,])), outdir = file.path(tempdir(), "tmp_map2_out.df"))
+  
+  expect_s3_class(df, "disk.frame")
+  
+  df2 = df %>% collect
+  
+  expect_s3_class(df2, "data.frame")
+  
+  expect_equal(nrow(df2), 10L)
+})
+
+test_that("testing map2 .y is not disk.frame", {
+  b = disk.frame(file.path(tempdir(), "tmp_map2.df"))
+  d = 1:nchunks(b)
+  
+  # return 1 row from each chunk
+  expect_warning(df <- cmap2(b, d, ~.x[1,.(y = .y)], outdir = "tmp_map2_out2.df"))
+  
+  expect_type(df, "list")
+  
+  df2 = df %>% rbindlist
+  
+  expect_s3_class(df2, "data.frame")
+  
+  expect_equal(nrow(df2), 5L)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_map2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_map2d.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_map2_out.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-merge.r b/tests/testthat/test-merge.r
new file mode 100644
index 00000000..41bb37e4
--- /dev/null
+++ b/tests/testthat/test-merge.r
@@ -0,0 +1,59 @@
+context("test-merge.disk.frame")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 151:250, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_merge.df"), nchunks = 5, overwrite = TRUE)
+  as.disk.frame(d, file.path(tempdir(), "tmp_merge2.df"), nchunks = 5, overwrite = TRUE)
+})
+
+test_that("testing merge of disk.frame", {
+  b.df = disk.frame(file.path(tempdir(), "tmp_merge.df"))
+  d.df = disk.frame(file.path(tempdir(), "tmp_merge2.df"))
+  
+  bd.df = merge(b.df, d.df, by = "b", outdir = file.path(tempdir(), "tmp_bd_merge.df"), overwrite = TRUE, merge_by_chunk_id = TRUE)
+  
+  expect_s3_class(bd.df, "disk.frame")
+  expect_equal(nrow(bd.df), 100)
+})
+
+test_that("testing merge of data.frame", {
+  b.df = disk.frame(file.path(tempdir(), "tmp_merge.df"))
+  d = data.frame(a = 151:250, b = 1:100)
+
+  bd.df = merge(b.df, d, by = "b", outdir = file.path(tempdir(), "tmp_bd_merge2.df"), overwrite = TRUE)
+
+  expect_s3_class(bd.df, "disk.frame")
+  expect_equal(nrow(bd.df), 100)
+
+  tmp  = collect(bd.df)
+
+  expect_s3_class(tmp, "data.frame")
+  expect_equal(nrow(tmp), 100)
+})
+
+test_that("testing error when merge_by_chunk = FALSE", {
+  b.df = disk.frame(file.path(tempdir(), "tmp_merge.df"))
+  d.df = disk.frame(file.path(tempdir(), "tmp_merge2.df"))
+  
+  testthat::expect_error()
+  expect_error(
+    merge(
+      b.df, 
+      d.df, 
+      by = "b", 
+      outdir = file.path(tempdir(), "tmp_bd_merge.df"), 
+      overwrite = TRUE, 
+      merge_by_chunkd_id  = FALSE
+    )
+  )
+})
+
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_merge.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_merge2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_bd_merge.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_bd_merge2.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-names.r b/tests/testthat/test-names.r
new file mode 100644
index 00000000..2d114aeb
--- /dev/null
+++ b/tests/testthat/test-names.r
@@ -0,0 +1,25 @@
+context("test-names")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_names.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing names", {
+  b = disk.frame(file.path(tempdir(), "tmp_names.df"))
+  
+  expect_setequal(colnames(b), c("a","b"))
+  expect_setequal(names(b), c("a","b"))
+})
+
+test_that("testing names with lazyfn", {
+  b = disk.frame(file.path(tempdir(), "tmp_names.df")) %>% 
+    mutate(d = a + b)
+  
+  expect_setequal(colnames(b), c("a","b", "d"))
+  expect_setequal(names(b), c("a","b", "d"))
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_names.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-nchunks.r b/tests/testthat/test-nchunks.r
new file mode 100644
index 00000000..bf716810
--- /dev/null
+++ b/tests/testthat/test-nchunks.r
@@ -0,0 +1,18 @@
+context("test-nchunks")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_chunks.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing nchunks", {
+  b = disk.frame(file.path(tempdir(), "tmp_chunks.df"))
+  
+  expect_equal(nchunks(b), 5)
+  expect_equal(nchunk(b), 5)
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_chunks.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-nrow-ncol.R b/tests/testthat/test-nrow-ncol.R
new file mode 100644
index 00000000..05b33601
--- /dev/null
+++ b/tests/testthat/test-nrow-ncol.R
@@ -0,0 +1,20 @@
+context("test-nrow-ncol")
+
+setup({
+  df = disk.frame:::gen_datatable_synthetic(1e3+11)
+  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete.csv"))
+})
+
+test_that("nrow ncol", {
+  dff = csv_to_disk.frame(
+    file.path(tempdir(), "tmp_pls_delete.csv"), 
+    file.path(tempdir(), "tmp_pls_delete.df"))
+  
+  expect_equal(nrow(dff), 1e3+11)
+  expect_equal(ncol(dff), 10)
+})
+
+teardown({
+  fs::file_delete(file.path(tempdir(), "tmp_pls_delete.csv"))
+  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-overwrite_check.r b/tests/testthat/test-overwrite_check.r
new file mode 100644
index 00000000..59f6548e
--- /dev/null
+++ b/tests/testthat/test-overwrite_check.r
@@ -0,0 +1,21 @@
+context("test-overwrite_check")
+
+setup({
+})
+
+test_that("testing overwrite_check", {
+  b = data.frame(a = 51:150, b = 1:100)
+  
+  fs::dir_create(file.path(tempdir(), "tmp_overwrite-check"))
+  fs::file_create(file.path(tempdir(), "tmp_overwrite-check/tmp"))
+  
+  
+  expect_error(disk.frame::overwrite_check(file.path(tempdir(), "tmp_overwrite-check"), overwrite = TRUE))
+  
+  expect_error(disk.frame::overwrite_check(file.path(tempdir(), "tmp_overwrite-check"), overwrite = FALSE))
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_overwrite-check"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-pls-add.r b/tests/testthat/test-pls-add.r
new file mode 100644
index 00000000..1cf8de5d
--- /dev/null
+++ b/tests/testthat/test-pls-add.r
@@ -0,0 +1,44 @@
+context("test-pls-add")
+
+setup({
+  #setup_disk.frame(workers = 1)
+})
+
+test_that("pls-add", {
+  
+  # if (interactive()) {
+  #   library(disk.frame)
+  #   library(tidyverse)
+  #   
+  #   setup_disk.frame(2)
+  #   example <- as.disk.frame(
+  #     data.frame(
+  #       purchase_date=c("2020-03-20","2020-04-20"),
+  #       a = 1:2,
+  #       b = 3:4
+  #     )
+  #   )
+  #   example %>% 
+  #     mutate(Panel_Month = str_sub(purchase_date, 6, 7)) %>% 
+  #     collect
+  #   
+  #   str_sub2 = function(xx, yy) xx + yy
+  #   
+  #   example %>% 
+  #     mutate(Panel_Month = str_sub2(a, b)) %>% 
+  #     collect
+  #   
+  #   example %>% 
+  #     mutate(Panel_Month = str_sub2(a, 7)) %>% 
+  #     collect
+  #   
+  #   example %>% 
+  #     mutate(Panel_Month = str_sub2(6, 7)) %>% 
+  #     collect
+  #   
+  #   
+  #   example %>% 
+  #     mutate(Panel_Month = str_subs(purchase_date, 7)) %>% 
+  #     collect
+  # }
+})
\ No newline at end of file
diff --git a/tests/testthat/test-print.r b/tests/testthat/test-print.r
new file mode 100644
index 00000000..9d1053cc
--- /dev/null
+++ b/tests/testthat/test-print.r
@@ -0,0 +1,14 @@
+context("test-print")
+
+setup({
+})
+
+test_that("testing print", {
+  # TODO proper tests
+  expect_equal(2L, 2L)
+})
+
+
+teardown({
+  
+})
\ No newline at end of file
diff --git a/tests/testthat/test-pull.r b/tests/testthat/test-pull.r
new file mode 100644
index 00000000..4acfa8d4
--- /dev/null
+++ b/tests/testthat/test-pull.r
@@ -0,0 +1,50 @@
+context("test-pull")
+
+
+test_that("pull with",  {
+  flights_df = as.disk.frame(nycflights13::flights)
+  
+  a = flights_df %>% 
+    pull(carrier, carrier)
+  
+  b = flights_df %>% collect() %>% pull(carrier, carrier)
+  
+  expect_equal(a, b)
+  
+  a = flights_df %>% 
+    pull(2, 2)
+  b = flights_df %>% collect() %>% pull(2, 2)
+  
+  expect_equal(a, b)
+  
+  a = flights_df %>% 
+    pull(-1, -1)
+  b = flights_df %>% collect() %>% pull(-1, -1)
+  expect_equal(a, b)
+  
+  delete(flights_df)
+})
+
+
+test_that("pull",  {
+  flights_df = as.disk.frame(nycflights13::flights)
+  
+  a = flights_df %>% 
+    pull(carrier)
+  b = flights_df %>% collect() %>% pull(carrier)
+  
+  expect_setequal(a, b)
+  
+  a = flights_df %>% 
+    pull(2)
+  b = flights_df %>% collect() %>% pull(2)
+  
+  expect_setequal(a, b)
+  
+  a = flights_df %>% 
+    pull(-1)
+  b = flights_df %>% collect() %>% pull(-1)
+  expect_setequal(a, b)
+  
+  delete(flights_df)
+})
diff --git a/tests/testthat/test-rbindlist.r b/tests/testthat/test-rbindlist.r
new file mode 100644
index 00000000..d30cada0
--- /dev/null
+++ b/tests/testthat/test-rbindlist.r
@@ -0,0 +1,31 @@
+context("test-rbindlist")
+
+setup({
+  as.disk.frame(disk.frame:::gen_datatable_synthetic(1e3+11), file.path(tempdir(), "tmp_rbindlist1.df"), overwrite=TRUE)
+  as.disk.frame(disk.frame:::gen_datatable_synthetic(1e3+11), file.path(tempdir(), "tmp_rbindlist2.df"), overwrite=TRUE)
+  as.disk.frame(disk.frame:::gen_datatable_synthetic(1e3+11), file.path(tempdir(), "tmp_rbindlist4.df"), overwrite=TRUE)
+})
+
+test_that("test rbindlist", {
+  df1 = disk.frame(file.path(tempdir(), "tmp_rbindlist1.df"))
+  df2 = disk.frame(file.path(tempdir(), "tmp_rbindlist2.df"))
+  
+  df3 = rbindlist.disk.frame(list(df1, df2), outdir = file.path(tempdir(), "tmp_rbindlist3.df"), overwrite=TRUE)
+  
+  expect_equal(nrow(df3), 2*(1e3+11))
+})
+
+test_that("test rbindlist accepts only list", {
+  df1 = disk.frame(file.path(tempdir(), "tmp_rbindlist4.df"))
+
+  expect_error(rbindlist.disk.frame(df1, outdir = file.path(tempdir(), "tmp_rbindlist5.df")))
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_rbindlist1.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rbindlist2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rbindlist3.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rbindlist4.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rbindlist5.df"))
+})
diff --git a/tests/testthat/test-rechunk.r b/tests/testthat/test-rechunk.r
new file mode 100644
index 00000000..68f59938
--- /dev/null
+++ b/tests/testthat/test-rechunk.r
@@ -0,0 +1,82 @@
+context("test-rechunk")
+
+setup({
+})
+
+test_that("testing rechunk 5 to 4", {
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_rechunks.df"), nchunks = 5, overwrite = T)
+
+  b = disk.frame(file.path(tempdir(), "tmp_rechunks.df"))
+  
+  b = rechunk(b, 4)
+  expect_equal(nrow(b), 100)
+  expect_equal(ncol(b), 2)
+  expect_equal(nchunk(b), 4)
+  
+  res = collect(b)[order(b)]
+  
+  expect_equal(res$b, 1:100)
+  expect_equal(res$a, 51:150)
+})
+
+test_that("testing rechunk 5 to 3", {
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_rechunks2.df"), nchunks = 5, overwrite = T)
+  
+  b = disk.frame(file.path(tempdir(), "tmp_rechunks2.df"))
+  
+  b = rechunk(b, 3)
+  expect_equal(nrow(b), 100)
+  expect_equal(ncol(b), 2)
+  expect_equal(nchunk(b), 3)
+  
+  res = collect(b)[order(b)]
+  
+  expect_equal(res$b, 1:100)
+  expect_equal(res$a, 51:150)
+})
+
+test_that("testing rechunk 5 to 6", {
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_rechunks3.df"), nchunks = 5, overwrite = T)
+  
+  b = disk.frame(file.path(tempdir(), "tmp_rechunks3.df"))
+  
+  b = rechunk(b, 6)
+  expect_equal(nrow(b), 100)
+  expect_equal(ncol(b), 2)
+  expect_equal(nchunk(b), 6)
+  
+  res = collect(b)[order(b)]
+  
+  expect_equal(res$b, 1:100)
+  expect_equal(res$a, 51:150)
+})
+
+test_that("testing rechunk 5 to 7", {
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_rechunks4.df"), nchunks = 5, overwrite = T)
+  
+  b = disk.frame(file.path(tempdir(), "tmp_rechunks4.df"))
+  
+  b = rechunk(b, 7)
+  expect_equal(nrow(b), 100)
+  expect_equal(ncol(b), 2)
+  expect_equal(nchunk(b), 7)
+  
+  res = collect(b)[order(b)]
+  
+  expect_equal(res$b, 1:100)
+  expect_equal(res$a, 51:150)
+})
+
+# TODO do shardby; it's kinda of mitigated by thorough testing on Fannie Mae
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_rechunks.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rechunks2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rechunks3.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_rechunks4.df"))
+})
diff --git a/tests/testthat/test-recommend_nchunk.R b/tests/testthat/test-recommend_nchunk.R
new file mode 100644
index 00000000..c5fbb109
--- /dev/null
+++ b/tests/testthat/test-recommend_nchunk.R
@@ -0,0 +1,16 @@
+context("test-recommend_nchunk")
+
+test_that("testing df_ram_size", {
+  expect_true(is.numeric(df_ram_size()))
+  
+  expect_true(!is.na(df_ram_size()))
+  expect_true(!is.null(df_ram_size()))
+  expect_true(!is.nan(df_ram_size()))
+  expect_true(is.finite(df_ram_size()))
+})
+  
+test_that("testing df_ram_size; guards #213", {
+  # TODO tests
+  expect_true(df_ram_size() >= 1)
+})
+
diff --git a/tests/testthat/test-remove_chunk.r b/tests/testthat/test-remove_chunk.r
new file mode 100644
index 00000000..8aec02ae
--- /dev/null
+++ b/tests/testthat/test-remove_chunk.r
@@ -0,0 +1,18 @@
+context("test-remove")
+
+test_that("testing remove chunk 3 of 5", {
+  b = data.frame(a = 51:150, b = 1:100)
+  tmp = file.path(tempdir(), "tmp_remove.df")
+  b = as.disk.frame(b, tmp, nchunks = 5, overwrite = T)
+  
+  b = remove_chunk(b, 3)
+  expect_equal(nrow(b), 80)
+  expect_equal(ncol(b), 2)
+  expect_equal(nchunk(b), 4)
+  
+  res <- collect(b)[order(b)]
+  
+  expect_equal(nrow(res), 80)
+  
+  delete(b)
+})
diff --git a/tests/testthat/test-right_join.r b/tests/testthat/test-right_join.r
new file mode 100644
index 00000000..27e532b4
--- /dev/null
+++ b/tests/testthat/test-right_join.r
@@ -0,0 +1,7 @@
+context("test-right_join")
+
+test_that("testing right_join", {
+  # TODO tests
+  expect_equal(2L, 2L)
+})
+
diff --git a/tests/testthat/test-sample_frac.r b/tests/testthat/test-sample_frac.r
new file mode 100644
index 00000000..8c45f8f7
--- /dev/null
+++ b/tests/testthat/test-sample_frac.r
@@ -0,0 +1,20 @@
+context("test-sampe_frac")
+
+setup({
+  a = data.frame(a = 1:100, b = 1:100)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_sample_frac.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing sample_frac", {
+  a = disk.frame(file.path(tempdir(), "tmp_sample_frac.df"))
+  a40 <- sample_frac(a, 0.4) %>% collect
+  
+  expect_equal(nrow(a40), 40)
+  
+  expect_error(a40 <- sample_frac(a, 0.4, weight = 1) %>% collect)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_sample_frac.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-sample_n.r b/tests/testthat/test-sample_n.r
new file mode 100644
index 00000000..faf76259
--- /dev/null
+++ b/tests/testthat/test-sample_n.r
@@ -0,0 +1,16 @@
+context("test-sample_n")
+
+setup({
+  a = data.frame(a = 1:100, b = 1:100)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_sample_n.df"), nchunks = 5, overwrite = T)
+})
+
+test_that("testing semi_join where right is data.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_sample_n.df"))
+  expect_error(a40 <- sample_n(a, 40) %>% collect)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_sample_n.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-sas_to_csv.r b/tests/testthat/test-sas_to_csv.r
new file mode 100644
index 00000000..0bdd6fa4
--- /dev/null
+++ b/tests/testthat/test-sas_to_csv.r
@@ -0,0 +1,8 @@
+# TODO everything
+
+context("test-sas_to_csv")
+
+test_that("testing sas_to_csv", {
+  # TODO tests
+  expect_equal(2L, 2L)
+})
diff --git a/tests/testthat/test-sas_to_disk.frame.r b/tests/testthat/test-sas_to_disk.frame.r
new file mode 100644
index 00000000..dbd64e3e
--- /dev/null
+++ b/tests/testthat/test-sas_to_disk.frame.r
@@ -0,0 +1,10 @@
+# TODO everything
+
+context("test-sas_to_disk.frame")
+
+
+test_that("testing sas_to_disk.frame", {
+  # TODO tests
+  expect_equal(2L, 2L)
+})
+
diff --git a/tests/testthat/test-semi_join.R b/tests/testthat/test-semi_join.R
new file mode 100644
index 00000000..7b96c3ac
--- /dev/null
+++ b/tests/testthat/test-semi_join.R
@@ -0,0 +1,72 @@
+context("test-semi_join")
+
+setup({
+  
+  a = data.frame(a = 1:100, b = 1:100)
+  b = data.frame(a = 51:150, b = 1:100)
+  d = data.frame(a = 1:50, b = 1:50)
+  
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_sj.df"), nchunks = 4, overwrite = TRUE)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_sj.df"), nchunks = 5, overwrite = TRUE)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_sj.df"), overwrite = TRUE)
+
+  as.disk.frame(a, file.path(tempdir(), "tmp_a_sj2.df"), nchunks = 4, overwrite = TRUE)
+  as.disk.frame(b, file.path(tempdir(), "tmp_b_sj2.df"), nchunks = 5, overwrite = TRUE)
+  as.disk.frame(d, file.path(tempdir(), "tmp_d_sj2.df"), overwrite = TRUE)
+})
+
+test_that("testing semi_join where right is data.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_sj.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_sj.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_sj.df"))
+  bc = collect(b)
+  dc = collect(d)
+  
+  abc = semi_join(a, bc, by = "a") %>% collect
+  expect_equal(nrow(abc), 50)
+  
+  abc0 = semi_join(a, bc, by = c("a","b")) %>% collect
+  expect_equal(nrow(abc0), 0)
+  
+  abc100 = semi_join(a, bc, by = "b") %>% collect
+  expect_equal(nrow(abc100), 100)
+  
+  abd50 = semi_join(a, dc, by = "b") %>% collect
+  expect_equal(nrow(abd50), 50)
+})
+
+test_that("testing semi_join where right is disk.frame", {
+  a = disk.frame(file.path(tempdir(), "tmp_a_sj2.df"))
+  b = disk.frame(file.path(tempdir(), "tmp_b_sj2.df"))
+  d = disk.frame(file.path(tempdir(), "tmp_d_sj2.df"))
+  
+  expect_warning({
+    ab = semi_join(a, b, by = "a", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab), 50)
+  
+  expect_warning({
+    ab0 = semi_join(a, b, by = c("a","b"), merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab0), 0)
+  
+  expect_warning({
+    ab100 = semi_join(a, b, by = "b", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ab100), 100)
+  
+  expect_warning({
+    ad50 = semi_join(a, d, by = "b", merge_by_chunk_id = F) %>% collect
+    })
+  expect_equal(nrow(ad50), 50)
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_a_sj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_sj.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_sj.df"))
+  
+  fs::dir_delete(file.path(tempdir(), "tmp_a_sj2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_b_sj2.df"))
+  fs::dir_delete(file.path(tempdir(), "tmp_d_sj2.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-setup.r b/tests/testthat/test-setup.r
new file mode 100644
index 00000000..4d3473d1
--- /dev/null
+++ b/tests/testthat/test-setup.r
@@ -0,0 +1,7 @@
+context("test-setup")
+
+test_that("testing sas_to_disk.frame", {
+  setup_disk.frame(workers = 2)
+  a = future::nbrOfWorkers()
+  expect_equal(a, 2)
+})
\ No newline at end of file
diff --git a/tests/testthat/test-shard.r b/tests/testthat/test-shard.r
new file mode 100644
index 00000000..0a2e28e5
--- /dev/null
+++ b/tests/testthat/test-shard.r
@@ -0,0 +1,28 @@
+context("test-shard")
+
+setup({
+})
+
+test_that("testing shard data.frame", {
+  set.seed(1)
+  a = data.table(a = rep(1:10, 10), b = 1:100)
+  a = shard(a, "a", nchunks = 2, overwrite = TRUE, outdir=file.path(tempdir(), "tmp_shard.df"))
+  
+  expect_equal(nchunks(a), 2)
+  expect_equal(nrow(a), 100)
+  expect_equal(ncol(a), 2)
+  
+  a1 = unique(get_chunk(a,1)$a)
+  a2 = unique(get_chunk(a,2)$a)
+  expect_equal(length(intersect(a1, a2)), 0)
+  
+  a3 = shard(a, "a", nchunks = 4, overwrite = TRUE)
+  
+  expect_equal(nchunks(a3), 4)
+  expect_equal(nrow(a3), 100)
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_shard.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-shardkey.r b/tests/testthat/test-shardkey.r
new file mode 100644
index 00000000..846b81bb
--- /dev/null
+++ b/tests/testthat/test-shardkey.r
@@ -0,0 +1,17 @@
+context("test-shardkey")
+
+setup({
+})
+
+test_that("testing shardkey", {
+  set.seed(1)
+  a = data.table(a = rep(1:10, 10), b = 1:100)
+  a = shard(a, "a", nchunks = 2, overwrite = TRUE, outdir=file.path(tempdir(), "tmp_shardkey.df"))
+  
+  expect_equal(shardkey(a), list(shardkey="a", shardchunks=2))
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_shardkey.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-sql_query.r b/tests/testthat/test-sql_query.r
new file mode 100644
index 00000000..7a270767
--- /dev/null
+++ b/tests/testthat/test-sql_query.r
@@ -0,0 +1,21 @@
+context("test-sql-query")
+
+test_that("testing sql_query", {
+  ## setup a dummy database
+  library(RSQLite)
+  library(DBI)
+
+  con <- dbConnect(RSQLite::SQLite(), ":memory:")
+  
+  dbWriteTable(con, "iris", iris)
+  
+  diskf1 <- sql_query_to_disk.frame(con, "select * from iris")
+  
+  diskf2 <- db_table_to_disk.frame(con, "iris")
+  
+  testthat::expect_equal(nrow(diskf1), 150)
+  testthat::expect_equal(nrow(diskf2), 150)
+  
+  DBI::dbDisconnect(con)
+  
+})
diff --git a/tests/testthat/test-srckeep.r b/tests/testthat/test-srckeep.r
new file mode 100644
index 00000000..5b6fa370
--- /dev/null
+++ b/tests/testthat/test-srckeep.r
@@ -0,0 +1,17 @@
+context("test-keep")
+
+setup({
+  b = data.frame(a = 51:150, b = 1:100)
+  as.disk.frame(b, file.path(tempdir(), "tmp_srckeep.df"), nchunks = 5, overwrite = TRUE)
+})
+
+test_that("testing srckeep", {
+  b = disk.frame(file.path(tempdir(), "tmp_srckeep.df"))
+  b1 = b %>% srckeep("a")
+  expect_equal(ncol(b1 %>% collect), 1)
+  expect_equal(colnames(b1 %>% collect), "a")
+})
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_srckeep.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-tbl_vars.r b/tests/testthat/test-tbl_vars.r
new file mode 100644
index 00000000..5cd00ffa
--- /dev/null
+++ b/tests/testthat/test-tbl_vars.r
@@ -0,0 +1,16 @@
+context("test-tbl_vars")
+
+setup({
+})
+
+test_that("testing tbl_vars", {
+  a = data.table(a = rep(1:10, 10), b = 1:100)
+  a = shard(a, "a", nchunks = 2, overwrite = TRUE, outdir=file.path(tempdir(), "tmp_tbl_vars.df"))
+  
+  expect_setequal(tbl_vars(a), c("a","b"))
+})
+
+
+teardown({
+  fs::dir_delete(file.path(tempdir(), "tmp_tbl_vars.df"))
+})
\ No newline at end of file
diff --git a/tests/testthat/test-util.r b/tests/testthat/test-util.r
new file mode 100644
index 00000000..a9db9f37
--- /dev/null
+++ b/tests/testthat/test-util.r
@@ -0,0 +1,8 @@
+context("test-util")
+
+test_that("testing evalparseglue", {
+  x = 2
+  y = 3
+  expect_equal(evalparseglue("{x}+{y}"), 5)
+})
+
diff --git a/tests/testthat/test-write_disk.frame.R b/tests/testthat/test-write_disk.frame.R
new file mode 100644
index 00000000..c5650c81
--- /dev/null
+++ b/tests/testthat/test-write_disk.frame.R
@@ -0,0 +1,39 @@
+context("test-write_disk.frame")
+
+test_that("as.disk.frame works", {
+  ROWS = 1e3+11
+
+  tmp_write_disk.frame = tempfile()
+  tmp_write_disk.frame2 = tempfile()
+  
+  df = disk.frame:::gen_datatable_synthetic(ROWS)
+  dfdf <- as.disk.frame(df, tmp_write_disk.frame, overwrite = TRUE, nchunks = 5)
+
+  a = dfdf %>% cmap(~{
+    .x[1,]
+  }) %>% write_disk.frame(outdir = tmp_write_disk.frame2, overwrite = T)
+
+  expect_equal(nrow(a), 5)
+
+  fs::dir_delete(tmp_write_disk.frame)
+  fs::dir_delete(tmp_write_disk.frame2)
+})
+
+test_that("as.disk.frame fails if data frame has list-columns", {
+    df <- tibble::tibble("a" = c(1,2,3), "b" = list("a", "b", "c"))
+    expect_error(as.disk.frame(df, file.path(tempdir(), "tmp_write_disk.frame"), overwrite = TRUE, nchunks = 6))
+})
+
+test_that("write_disk.frame shard works", {
+  mtcars_df = as.disk.frame(
+    mtcars, 
+    outdir = file.path(tempdir(), "mt_shard_by_cyl"), 
+    shardby = c("cyl","vs"), 
+    nchunks = 3, 
+    overwrite = TRUE)
+  
+  res = mtcars_df %>% collect_list
+  expect_equal(length(res), 3)
+  testthat::expect_type(res, "list")
+  
+})
diff --git a/tests/testthat/test-zip_to_disk.frame.r b/tests/testthat/test-zip_to_disk.frame.r
new file mode 100644
index 00000000..b2e4c31e
--- /dev/null
+++ b/tests/testthat/test-zip_to_disk.frame.r
@@ -0,0 +1,7 @@
+context("test-zip_to_disk.frame")
+
+# TODO do some testing
+test_that("testing zip_to_disk.frame", {
+  expect_true(TRUE)
+})
+

From d2901f6a69174c927175f4cc9c53e080ab2c54db Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Fri, 28 Jan 2022 00:16:10 +1100
Subject: [PATCH 5/9] massively simplified the NSE for many parts now

---
 DESCRIPTION                                  |  4 +-
 NAMESPACE                                    |  2 -
 R/as.disk.frame.r                            |  1 -
 R/chunk_mapper.r                             | 13 ++--
 R/cmap.r                                     | 77 ++-----------------
 R/collect.r                                  |  5 +-
 R/left_join.r                                | 79 ++++++++++++++++----
 R/names.r                                    |  3 +-
 R/play.r                                     |  7 +-
 R/print.disk.frame.r                         | 25 +++++--
 man/chunk_group_by.Rd                        |  9 ++-
 man/dplyr_verbs.Rd                           |  3 -
 tests/testthat/{test-map.r => test-cmap.r}   | 24 +++---
 tests/testthat/{test-map2.r => test-cmap2.r} |  0
 tests/testthat/test-left_join.R              |  5 +-
 15 files changed, 128 insertions(+), 129 deletions(-)
 rename tests/testthat/{test-map.r => test-cmap.r} (75%)
 rename tests/testthat/{test-map2.r => test-cmap2.r} (100%)

diff --git a/DESCRIPTION b/DESCRIPTION
index c7e2c23d..74e992f3 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -1,8 +1,8 @@
 Type: Package
 Package: disk.frame
 Title: Larger-than-RAM Disk-Based Data Manipulation Framework
-Version: 0.5.0
-Date: 2021-05-09
+Version: 0.5.99.999
+Date: 2022-01-26
 Authors@R: c(
   person("Dai", "ZJ", email = "zhuojia.dai@gmail.com", role = c("aut", "cre")),
   person("Jacky", "Poon", role = c("ctb"))
diff --git a/NAMESPACE b/NAMESPACE
index 60830169..ae676874 100644
--- a/NAMESPACE
+++ b/NAMESPACE
@@ -57,7 +57,6 @@ S3method(transmute,disk.frame)
 export(IQR_df.chunk_agg.disk.frame)
 export(IQR_df.collected_agg.disk.frame)
 export(add_chunk)
-export(add_tally.disk.frame)
 export(all_df.chunk_agg.disk.frame)
 export(all_df.collected_agg.disk.frame)
 export(any_df.chunk_agg.disk.frame)
@@ -160,7 +159,6 @@ importFrom(data.table,setDT)
 importFrom(data.table,setkey)
 importFrom(data.table,setkeyv)
 importFrom(data.table,timetaken)
-importFrom(dplyr,add_tally)
 importFrom(dplyr,anti_join)
 importFrom(dplyr,arrange)
 importFrom(dplyr,bind_rows)
diff --git a/R/as.disk.frame.r b/R/as.disk.frame.r
index f55c2a78..2e208e03 100644
--- a/R/as.disk.frame.r
+++ b/R/as.disk.frame.r
@@ -25,7 +25,6 @@
 #' delete(cars_new_location.df)
 #' delete(cars_chunks.df)
 as.disk.frame <- function(df, outdir = tempfile(fileext = ".df"), nchunks = recommend_nchunks(df), overwrite = FALSE, shardby = NULL, compress = 50,...) {
-  
   stopifnot("data.frame" %in% class(df))
   overwrite_check(outdir, overwrite)
   data.table::setDT(df)
diff --git a/R/chunk_mapper.r b/R/chunk_mapper.r
index fd344de7..489c7c20 100644
--- a/R/chunk_mapper.r
+++ b/R/chunk_mapper.r
@@ -44,9 +44,9 @@ create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FA
     }
     
     # you need to use list otherwise the names will be gone
-    code = substitute(chunk_fn(...))
+    code = substitute(chunk_fn(.disk.frame.chunk, ...))
     
-    if (deparse(code) == "chunk_fn(NULL)") {
+    if (paste0(deparse(code), collapse="") == "chunk_fn(NULL)") {
       globals_and_pkgs = future::getGlobalsAndPackages(expression(chunk_fn()))
     } else {
       globals_and_pkgs = future::getGlobalsAndPackages(code)
@@ -57,18 +57,17 @@ create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FA
     
     env = parent.frame()
     
-    done = identical(env, globalenv())
-    
-    # keep adding global variables
+    done = identical(env, emptyenv()) || identical(env, globalenv())
     
+    # keep adding global variables by moving up the environment chain
     while(!done) {
       tmp_globals_and_pkgs = future::getGlobalsAndPackages(code, envir = env)
       new_global_vars = tmp_globals_and_pkgs$globals
       for (name in setdiff(names(new_global_vars), names(global_vars))) {
-        global_vars[name] = new_global_vars[[name]]
+        global_vars[[name]] <- new_global_vars[[name]]
       }
       
-      done = identical(env, globalenv())
+      done = identical(env, emptyenv()) || identical(env, globalenv())
       env = parent.env(env)
     }
     
diff --git a/R/cmap.r b/R/cmap.r
index 25e5d2c1..f4eebe60 100644
--- a/R/cmap.r
+++ b/R/cmap.r
@@ -47,78 +47,11 @@ cmap <- function(.x, .f, ...) {
 cmap.disk.frame <- function(
                     .x, 
                     .f, 
-                    ..., 
-                    outdir = NULL, 
-                    keep = NULL, 
-                    chunks = nchunks(.x), 
-                    compress = 50, 
-                    lazy = TRUE, 
-                    overwrite = FALSE, 
-                    vars_and_pkgs = future::getGlobalsAndPackages(.f, envir = parent.frame()), .progress = TRUE) {
+                    ...) {
   .f = purrr::as_mapper(.f)
-  if(lazy) {
-    attr(.x, "lazyfn") = 
-      c(
-        attr(.x, "lazyfn"), 
-        list(
-          list(
-            func = .f, 
-            vars_and_pkgs = vars_and_pkgs, 
-            dotdotdot = list(...)
-          )
-        )
-      )
-    return(.x)
-  }
-  
-  if(!is.null(outdir)) {
-    overwrite_check(outdir, overwrite)
-  }
-  
-  stopifnot(is_ready(.x))
-  
-  keep1 = attr(.x,"keep", exact=TRUE)
-  
-  if(is.null(keep)) {
-    keep = keep1
-  }
-  
-  path <- attr(.x, "path")
-  files <- list.files(path, full.names = TRUE)
-  files_shortname <- list.files(path)
-  
-  keep_future = keep
-  
-  cid = get_chunk_ids(.x, full.names = TRUE)
-  
-  dotdotdot = list(...)
-  
-  res = future.apply::future_lapply(1:length(files), function(ii, ...) {
-  #res = lapply(1:length(files), function(ii) {
-    ds = disk.frame::get_chunk(.x, cid[ii], keep=keep_future, full.names = TRUE)
-    
-    res = .f(ds, ...)
-    # res = do.call(.f, c(ds, dotdotdot))
-    
-    if(!is.null(outdir)) {
-      if(nrow(res) == 0) {
-        warning(glue::glue("The output chunk has 0 row, therefore chunk {ii} NOT written"))
-      } else {
-        fst::write_fst(res, file.path(outdir, files_shortname[ii]), compress)
-      }
-      return(ii)
-    } else {
-      return(res)
-    }
-  }, ..., 
-  future.seed=TRUE # to get rid of the error TODO investigate making this better
-  )
   
-  if(!is.null(outdir)) {
-    return(disk.frame(outdir))
-  } else {
-    return(write_disk.frame(outdir, ..f(.x), ...))
-  }
+  result = create_chunk_mapper(.f)(.x, ...)
+  return(result)
 }
 
 #' @export
@@ -134,8 +67,8 @@ cmap_dfr.disk.frame <- function(.x, .f, ..., .id = NULL, use.names = fill, fill
     warning(".id is not NULL, but the parameter is not used with cmap_dfr.disk.frame")
   }
   
-  # TODO warn the user if outdir is cmap_dfr
-  data.table::rbindlist(cmap.disk.frame(.x, .f, ..., outdir = NULL, lazy = FALSE), use.names = use.names, fill = fill, idcol = idcol)
+  list_df = collect_list(cmap.disk.frame(.x, .f, ...))
+  data.table::rbindlist(list_df, use.names = use.names, fill = fill, idcol = idcol)
 }
 
 
diff --git a/R/collect.r b/R/collect.r
index 4f1d4528..16ae35a3 100644
--- a/R/collect.r
+++ b/R/collect.r
@@ -23,7 +23,7 @@
 #' delete(cars.df)
 #' @export
 #' @rdname collect
-collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"lazyfn"))) {
+collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
   cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
   #cids = as.integer(get_chunk_ids(x))
   if(nchunks(x) > 0) {
@@ -59,8 +59,7 @@ collect_list <- function(x, simplify = FALSE, parallel = !is.null(attr(x,"record
   if(length(cids) > 0) {
     list_of_results = NULL
     if (parallel) {
-      #res = furrr::future_map(1:nchunks(x), ~get_chunk(x, .x))
-      res = future.apply::future_lapply(cids, function(.x) {
+      list_of_results = future.apply::future_lapply(cids, function(.x) {
         get_chunk(x, .x, full.names = TRUE)
       }, future.seed=TRUE)
     } else {
diff --git a/R/left_join.r b/R/left_join.r
index 4c1b6e3b..b4835da9 100644
--- a/R/left_join.r
+++ b/R/left_join.r
@@ -1,3 +1,5 @@
+left_join_y_is_data.frame = create_chunk_mapper(dplyr::left_join)
+
 #' Performs join/merge for disk.frames
 #' @rdname join
 #' @export
@@ -9,21 +11,14 @@
 #' # clean up cars.df
 #' delete(cars.df)
 #' delete(join.df)
-left_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfile("tmp_disk_frame_left_join"), merge_by_chunk_id = FALSE, overwrite = TRUE, .progress = FALSE) {
+left_join.disk.frame = function(x, y, by=NULL, copy=FALSE, suffix=c(".x", ".y"), ..., keep=FALSE, outdir = tempfile("tmp_disk_frame_left_join"), merge_by_chunk_id = FALSE, overwrite = TRUE, .progress = FALSE) {
   stopifnot("disk.frame" %in% class(x))
   
-  overwrite_check(outdir, overwrite)
-  
-  if("data.frame" %in% class(y)) {
-    # note that x is named .data in the lazy evaluation
-    quo_dotdotdot = enquos(...)
-    cmap_dfr(x, ~{
-      code = quo(left_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
-      rlang::eval_tidy(code)
-    }, .progress = .progress)
-  } else if("disk.frame" %in% class(y)) {
+  if ("data.frame" %in% class(y)) {
+    left_join_y_is_data.frame(x, y, by=by, copy=copy, suffix=suffix, ..., keep=keep)
+  } else {
     if(is.null(merge_by_chunk_id)) {
-      stop("both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly")
+      stop("Both `x` and `y` are disk.frames. You need to specify `merge_by_chunk_id = TRUE` or `FALSE` explicitly")
     }
     if(is.null(by)) {
       by <- intersect(names(x), names(y))
@@ -32,12 +27,12 @@ left_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
     ncx = nchunks(x)
     ncy = nchunks(y)
     if (merge_by_chunk_id == FALSE) {
-      warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
+      warning("`merge_by_chunk_id = FALSE`. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making `y` a data.frame or set merge_by_chunk_id = TRUE for better performance.")
       x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
       y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
       return(left_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
     } else if(merge_by_chunk_id == TRUE) {
-    #} else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
+      #} else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
       dotdotdot = list(...)
       res = cmap2.disk.frame(x, y, ~{
         if(is.null(.y)) {
@@ -56,3 +51,59 @@ left_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
     }
   }
 }
+  
+# 
+# left_join.disk.frame_backup <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfile("tmp_disk_frame_left_join"), merge_by_chunk_id = FALSE, overwrite = TRUE, .progress = FALSE) {
+#   
+#   stopifnot("disk.frame" %in% class(x))
+#   
+#   overwrite_check(outdir, overwrite)
+#   
+#   if("data.frame" %in% class(y)) {
+#     # note that x is named .data in the lazy evaluation
+#     quo_dotdotdot = enquos(...)
+#     
+#     browser()
+#     cmap(x, ~{
+#       left_join(.x, y, by = by, copy = copy, ...)
+#     }, lazy = FALSE, outdir = outdir, overwrite=TRUE)
+#     
+#     cmap_dfr(x, ~{
+#       code = quo(left_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
+#       rlang::eval_tidy(code)
+#     }, .progress = .progress)
+#   } else if("disk.frame" %in% class(y)) {
+#     if(is.null(merge_by_chunk_id)) {
+#       stop("both `x` and `y` are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly")
+#     }
+#     if(is.null(by)) {
+#       by <- intersect(names(x), names(y))
+#     }
+#     
+#     ncx = nchunks(x)
+#     ncy = nchunks(y)
+#     if (merge_by_chunk_id == FALSE) {
+#       warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
+#       x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+#       y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+#       return(left_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
+#     } else if(merge_by_chunk_id == TRUE) {
+#     #} else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
+#       dotdotdot = list(...)
+#       res = cmap2.disk.frame(x, y, ~{
+#         if(is.null(.y)) {
+#           return(.x)
+#         } else if (is.null(.x)) {
+#           return(data.table())
+#         }
+#         llj = purrr::lift(dplyr::left_join)
+#         #left_join(.x, .y, by = by, copy = copy, ...)
+#         llj(c(list(x=.x, y =.y, by = by, copy = copy), dotdotdot))
+#       }, outdir = outdir)
+#       return(res)
+#     } else {
+#       # TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine
+#       stop("merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE")
+#     }
+#   }
+# }
diff --git a/R/names.r b/R/names.r
index 2655f80e..05d047da 100644
--- a/R/names.r
+++ b/R/names.r
@@ -25,7 +25,8 @@ names.disk.frame <- function(x, ...) {
 #' @export
 colnames.disk.frame <- function(x, ...) {
   res = attr(x, "path", exact=TRUE) %>% 
-    fs::dir_ls(type="file")
+    list.files(full.names = TRUE)
+  
   if(is.null(attr(x, "recordings"))) {
     if(length(res) == 0) {
       return(vector("character"))
diff --git a/R/play.r b/R/play.r
index 9f3f4011..b5ee9fe7 100644
--- a/R/play.r
+++ b/R/play.r
@@ -4,8 +4,11 @@
 play <- function(dataframe, recordings) {
   for(recording in recordings) {
     tmp_env = list2env(recording$globals)
-    one_recording_as_string = paste0(deparse(recording$expr), collapse = "")
-    code = str2lang(sprintf("dataframe %%>%% %s", one_recording_as_string))
+    
+    # replace .disk.frame.chunk with dataframe in the function
+    code = eval(bquote(substitute(.(recording$expr), list(.disk.frame.chunk=quote(dataframe)))))
+    
+    # execute the delayed function
     dataframe = eval(code, envir = tmp_env)
   }
   dataframe
diff --git a/R/print.disk.frame.r b/R/print.disk.frame.r
index fe739059..5ff81516 100644
--- a/R/print.disk.frame.r
+++ b/R/print.disk.frame.r
@@ -7,13 +7,22 @@
 #' @importFrom glue glue
 # TODO add chunk
 print.disk.frame <- function(x, ...) {
-  a = paste(sep = "\n"
-             ,glue::glue("path: \"{attr(x,'path', exact=TRUE)}\"")
-             ,glue::glue("nchunks: {disk.frame::nchunks(x)}")
-             ,glue::glue("nrow (at source): {disk.frame::nrow(x)}")
-             ,glue::glue("ncol (at source): {disk.frame::ncol(x)}")
-             ,glue::glue("nrow (post operations): ???")
-             ,glue::glue("ncol (post operations): ???\n")
-  )
+  if (is.null(attr(x, "recordings"))) {
+    a = paste(sep = "\n"
+              ,glue::glue("path: \"{attr(x,'path', exact=TRUE)}\"")
+              ,glue::glue("nchunks: {disk.frame::nchunks(x)}")
+              ,glue::glue("nrow (at source): {disk.frame::nrow(x)}")
+              ,glue::glue("ncol (at source): {disk.frame::ncol(x)}")
+    )
+  } else {
+    a = paste(sep = "\n"
+               ,glue::glue("path: \"{attr(x,'path', exact=TRUE)}\"")
+               ,glue::glue("nchunks: {disk.frame::nchunks(x)}")
+               ,glue::glue("nrow (at source): {disk.frame::nrow(x)}")
+               ,glue::glue("ncol (at source): {disk.frame::ncol(x)}")
+               ,glue::glue("nrow (post operations): ???")
+               ,glue::glue("ncol (post operations): ???\n")
+    )
+  }
   message(a)
 }
diff --git a/man/chunk_group_by.Rd b/man/chunk_group_by.Rd
index f06836c2..fac8791c 100644
--- a/man/chunk_group_by.Rd
+++ b/man/chunk_group_by.Rd
@@ -5,7 +5,14 @@
 \alias{chunk_summarise}
 \alias{chunk_group_by}
 \alias{chunk_ungroup}
-\title{Group by within each disk.frame}
+\title{#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame <- create_chunk_mapper(dplyr::add_count)
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame <- create_chunk_mapper(dplyr::add_tally)}
 \usage{
 chunk_summarize(.data, ...)
 
diff --git a/man/dplyr_verbs.Rd b/man/dplyr_verbs.Rd
index 0590bf8f..cfebebb4 100644
--- a/man/dplyr_verbs.Rd
+++ b/man/dplyr_verbs.Rd
@@ -8,7 +8,6 @@
 \alias{transmute.disk.frame}
 \alias{arrange.disk.frame}
 \alias{chunk_arrange}
-\alias{add_tally.disk.frame}
 \alias{distinct.disk.frame}
 \alias{chunk_distinct}
 \alias{glimpse.disk.frame}
@@ -28,8 +27,6 @@
 
 chunk_arrange(.data, ...)
 
-add_tally.disk.frame(.data, ...)
-
 \method{distinct}{disk.frame}(...)
 
 chunk_distinct(.data, ...)
diff --git a/tests/testthat/test-map.r b/tests/testthat/test-cmap.r
similarity index 75%
rename from tests/testthat/test-map.r
rename to tests/testthat/test-cmap.r
index beec44ba..f095956b 100644
--- a/tests/testthat/test-map.r
+++ b/tests/testthat/test-cmap.r
@@ -20,18 +20,18 @@ test_that("testing cmap lazy", {
   expect_equal(nrow(df2), 5L)
 })
 
-test_that("testing cmap eager", {
-  b = disk.frame(file.path(tempdir(), "tmp_map.df"))
-  
-  # return 1 row from each chunk
-  df = b %>% cmap(~.x[1], lazy = F)
-  expect_false("disk.frame" %in% class(df))
-
-  # return 1 row from each chunk
-  df = b %>% cmap_dfr(~.x[1])
-  expect_false("disk.frame" %in% class(df))
-  expect_true("data.frame" %in% class(df))
-})
+# test_that("testing cmap eager", {
+#   b = disk.frame(file.path(tempdir(), "tmp_map.df"))
+#   
+#   # return 1 row from each chunk
+#   df = b %>% cmap(~.x[1], lazy = FALSE)
+#   expect_false("disk.frame" %in% class(df))
+# 
+#   # return 1 row from each chunk
+#   df = b %>% cmap_dfr(~.x[1])
+#   expect_false("disk.frame" %in% class(df))
+#   expect_true("data.frame" %in% class(df))
+# })
 
 test_that("testing delayed", {
   b = disk.frame(file.path(tempdir(), "tmp_map.df"))
diff --git a/tests/testthat/test-map2.r b/tests/testthat/test-cmap2.r
similarity index 100%
rename from tests/testthat/test-map2.r
rename to tests/testthat/test-cmap2.r
diff --git a/tests/testthat/test-left_join.R b/tests/testthat/test-left_join.R
index 66801085..e08e58b1 100644
--- a/tests/testthat/test-left_join.R
+++ b/tests/testthat/test-left_join.R
@@ -1,7 +1,6 @@
 context("test-left_join")
 
 setup({
-  
   a = data.frame(a = 1:100, b = 1:100)
   b = data.frame(a = 51:150, b = 1:100)
   d = data.frame(a = 1:50, b = 1:50)
@@ -28,6 +27,10 @@ test_that("testing left_join where right is data.frame", {
   abc0 = left_join(a, bc, by = c("a","b")) %>% collect
   expect_equal(nrow(abc0), 100)
   
+  by_cols = c("a","b")
+  abc0 = left_join(a, bc, by = by_cols) %>% collect
+  expect_equal(nrow(abc0), 100)
+  
   abc100 = left_join(a, bc, by = "b") %>% collect
   expect_equal(nrow(abc100), 100)
   

From a08485c1988aa380d1e7861cbd3097677a921050 Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Sun, 30 Jan 2022 23:08:14 +1100
Subject: [PATCH 6/9] ready to go!

---
 CRAN-RELEASE                         |   3 -
 DESCRIPTION                          |   5 +-
 NAMESPACE                            |  15 +-
 R/anti_join.r                        |  15 +-
 R/bind_rows.r                        |   6 +
 R/chunk_mapper.r                     |   3 +-
 R/collect.r                          |   9 +-
 R/collect.summarized_disk.frame.r    | 130 +++++++-
 R/csv2disk.frame.r                   |  28 +-
 R/data.table.r                       |  59 ++--
 R/dplyr_verbs.r                      |   9 -
 R/foverlaps.disk.frame.r             |   2 +-
 R/full_join.r                        |   8 +-
 R/get_chunk.r                        |   2 +
 R/hard_arrange.r                     | 128 ++++----
 R/hard_group_by.r                    | 428 +++++++++++++--------------
 R/inner_join.r                       |  20 +-
 R/left_join.r                        |  68 +----
 R/map2.r                             |  20 +-
 R/one-stage-verbs.R                  | 193 +++---------
 R/rbindlist.disk.frame.r             |   2 +-
 R/rechunk.r                          |  26 +-
 R/recommend_nchunks.r                |   2 -
 R/semi_join.r                        |  12 +-
 R/shard.r                            |  43 +--
 R/util.r                             |   2 +-
 R/write_disk.frame.r                 |   4 +-
 man/bind_rows.disk.frame.Rd          |  14 +
 man/cmap.Rd                          |  22 +-
 man/collect.Rd                       |   2 +-
 man/csv_to_disk.frame.Rd             |   3 +-
 man/group_by.Rd                      |   7 +-
 man/hard_arrange.Rd                  |  53 ----
 man/hard_group_by.Rd                 |  65 ----
 man/join.Rd                          |   4 +
 man/purrr_as_mapper.Rd               |   4 +-
 man/rbindlist.disk.frame.Rd          |   2 +-
 man/rechunk.Rd                       |   7 +-
 man/shard.Rd                         |   5 +-
 misc/NAMESPACE_20190205              |  99 -------
 misc/NAMESPACE_ok                    |  61 ----
 tests/testthat/test-anti_join.R      |   6 +-
 tests/testthat/test-cmap2.r          |   2 +-
 tests/testthat/test-csv2disk.frame.r |   8 +-
 tests/testthat/test-data-table.r     |  37 ++-
 tests/testthat/test-dplyr-verbs.r    |   4 +-
 tests/testthat/test-group-by.R       | 280 +++++++++---------
 tests/testthat/test-hard-arrange.R   | 222 +++++++-------
 tests/testthat/test-left_join.R      |   1 +
 tests/testthat/test-rechunk.r        |  15 +-
 tests/testthat/test-sql_query.r      |  32 +-
 tests/testthat/test-srckeep.r        |   2 +-
 52 files changed, 946 insertions(+), 1253 deletions(-)
 delete mode 100644 CRAN-RELEASE
 create mode 100644 R/bind_rows.r
 create mode 100644 man/bind_rows.disk.frame.Rd
 delete mode 100644 man/hard_arrange.Rd
 delete mode 100644 man/hard_group_by.Rd
 delete mode 100644 misc/NAMESPACE_20190205
 delete mode 100644 misc/NAMESPACE_ok

diff --git a/CRAN-RELEASE b/CRAN-RELEASE
deleted file mode 100644
index cc7dafeb..00000000
--- a/CRAN-RELEASE
+++ /dev/null
@@ -1,3 +0,0 @@
-This package was submitted to CRAN on 2021-05-13.
-Once it is accepted, delete this file and tag the release (commit 01d247f).
-
diff --git a/DESCRIPTION b/DESCRIPTION
index 74e992f3..328f6a66 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -17,7 +17,6 @@ License: MIT + file LICENSE
 Imports:
     Rcpp (>= 0.12.13),
     glue (>= 1.3.1),
-    rlang (>= 0.4.0),
     future.apply (>= 1.3.0),
     fs (>= 1.3.1),
     jsonlite (>= 1.6),
@@ -28,10 +27,10 @@ Imports:
     data.table (>= 1.12.2),
     crayon (>= 1.3.4),
     bigreadr (>= 0.2.0),
-    furrr (>= 0.2.2),
     bit64,
     benchmarkme,
-    purrr (>= 0.3.2)
+    purrr (>= 0.3.2),
+    rlang
 Depends:
     R (>= 3.4),
     dplyr (>= 1.0.0)
diff --git a/NAMESPACE b/NAMESPACE
index ae676874..2def4912 100644
--- a/NAMESPACE
+++ b/NAMESPACE
@@ -24,10 +24,6 @@ S3method(glimpse,disk.frame)
 S3method(group_by,disk.frame)
 S3method(group_vars,disk.frame)
 S3method(groups,disk.frame)
-S3method(hard_arrange,data.frame)
-S3method(hard_arrange,disk.frame)
-S3method(hard_group_by,data.frame)
-S3method(hard_group_by,disk.frame)
 S3method(head,disk.frame)
 S3method(inner_join,disk.frame)
 S3method(lazy,disk.frame)
@@ -62,6 +58,7 @@ export(all_df.collected_agg.disk.frame)
 export(any_df.chunk_agg.disk.frame)
 export(any_df.collected_agg.disk.frame)
 export(as.disk.frame)
+export(bind_rows.disk.frame)
 export(ceremony_text)
 export(chunk_arrange)
 export(chunk_distinct)
@@ -91,8 +88,6 @@ export(foverlaps.disk.frame)
 export(gen_datatable_synthetic)
 export(get_chunk)
 export(get_chunk_ids)
-export(hard_arrange)
-export(hard_group_by)
 export(insert_ceremony)
 export(is_disk.frame)
 export(lazy)
@@ -156,7 +151,6 @@ importFrom(data.table,foverlaps)
 importFrom(data.table,fread)
 importFrom(data.table,rbindlist)
 importFrom(data.table,setDT)
-importFrom(data.table,setkey)
 importFrom(data.table,setkeyv)
 importFrom(data.table,timetaken)
 importFrom(dplyr,anti_join)
@@ -212,9 +206,7 @@ importFrom(purrr,map2)
 importFrom(purrr,map_chr)
 importFrom(purrr,map_dfr)
 importFrom(purrr,map_lgl)
-importFrom(rlang,enquos)
-importFrom(rlang,eval_tidy)
-importFrom(rlang,quo)
+importFrom(rlang,enexpr)
 importFrom(stats,median)
 importFrom(stats,quantile)
 importFrom(stats,runif)
@@ -222,9 +214,6 @@ importFrom(stringr,fixed)
 importFrom(utils,capture.output)
 importFrom(utils,head)
 importFrom(utils,memory.limit)
-importFrom(utils,methods)
-importFrom(utils,setTxtProgressBar)
 importFrom(utils,tail)
-importFrom(utils,txtProgressBar)
 importFrom(utils,unzip)
 useDynLib(disk.frame)
diff --git a/R/anti_join.r b/R/anti_join.r
index dc473a6e..91acffd9 100644
--- a/R/anti_join.r
+++ b/R/anti_join.r
@@ -5,7 +5,6 @@
 #' @param .progress Show progress or not. Defaults to FALSE
 #' @param ... same as dplyr's joins
 #' @rdname join
-#' @importFrom rlang quo enquos
 #' @importFrom dplyr anti_join left_join full_join semi_join inner_join
 #' @return disk.frame or data.frame/data.table
 #' @export
@@ -29,11 +28,11 @@ anti_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
   overwrite_check(outdir, overwrite)
   
   if("data.frame" %in% class(y)) {
-    quo_dotdotdot = enquos(...)
-    cmap_dfr.disk.frame(x, ~{
-      code = quo(anti_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
-      rlang::eval_tidy(code)
+    tmp = cmap.disk.frame(x, ~{
+      anti_join(.x, y, by = by, copy = copy, ...)
     }, .progress = .progress)
+    
+    return(tmp)
   } else if("disk.frame" %in% class(y)) {
     if(is.null(merge_by_chunk_id)) {
       stop("both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly")
@@ -47,12 +46,12 @@ anti_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
     if (merge_by_chunk_id == FALSE) {
       warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
       
-      x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+      ncxy = max(ncy,ncx)
+      x = rechunk(x, shardby=by, nchunks = ncxy, outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
+      y = rechunk(y, shardby=by, nchunks =ncxy, outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
       return(anti_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite))
     } else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
       res = cmap2.disk.frame(x, y, ~{
-      #res = cmap2(x, y, ~{
         if(is.null(.y)) {
           return(.x)
         } else if (is.null(.x)) {
diff --git a/R/bind_rows.r b/R/bind_rows.r
new file mode 100644
index 00000000..bd5fbe76
--- /dev/null
+++ b/R/bind_rows.r
@@ -0,0 +1,6 @@
+#' Bind rows
+#' @param ... 
+#' @export
+bind_rows.disk.frame <- function(...) {
+  rbindlist.disk.frame(list(...))
+}
\ No newline at end of file
diff --git a/R/chunk_mapper.r b/R/chunk_mapper.r
index 489c7c20..1b0d3ff7 100644
--- a/R/chunk_mapper.r
+++ b/R/chunk_mapper.r
@@ -31,7 +31,6 @@
 #' @param chunk_fn The dplyr function to create a mapper for
 #' @param warning_msg The warning message to display when invoking the mapper
 #' @param as.data.frame force the input chunk of a data.frame; needed for dtplyr
-#' @importFrom rlang enquos quo
 #' @export
 create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FALSE) {
   if(as.data.frame) {
@@ -40,7 +39,7 @@ create_chunk_mapper <- function(chunk_fn, warning_msg = NULL, as.data.frame = FA
   
   return(function(.data, ...) {
     if(!is.null(warning_msg)) {
-      print(warning_msg)
+      warning(warning_msg)
     }
     
     # you need to use list otherwise the names will be gone
diff --git a/R/collect.r b/R/collect.r
index 16ae35a3..cf5add15 100644
--- a/R/collect.r
+++ b/R/collect.r
@@ -25,13 +25,12 @@
 #' @rdname collect
 collect.disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
   cids = get_chunk_ids(x, full.names = TRUE, strip_extension = FALSE)
-  #cids = as.integer(get_chunk_ids(x))
   if(nchunks(x) > 0) {
     if(parallel) {
-      future.apply::future_lapply(cids, function(.x) {
-                              get_chunk(x, .x, full.names = TRUE)
-      }, future.seed = TRUE) %>% 
-        rbindlist()
+      tmp = future.apply::future_lapply(cids, function(.x) {
+          get_chunk(x, .x, full.names = TRUE)
+      }, future.seed = TRUE)
+      return(rbindlist(tmp))
     } else {
       purrr::map_dfr(cids, ~get_chunk(x, .x, full.names = TRUE))
     }
diff --git a/R/collect.summarized_disk.frame.r b/R/collect.summarized_disk.frame.r
index 64a0b514..edd686a4 100644
--- a/R/collect.summarized_disk.frame.r
+++ b/R/collect.summarized_disk.frame.r
@@ -23,8 +23,128 @@
 #' delete(cars.df)
 #' @export
 #' @rdname collect
-collect.summarized_disk.frame <- function(x, ..., parallel = !is.null(attr(x,"recordings"))) {
-  code_to_run = glue::glue("x %>% {attr(x, 'summarize_code') %>% as.character}")
-  class(x) <- "disk.frame"
-  eval(parse(text = code_to_run))
-}
+collect.summarized_disk.frame <-
+  function(x, ..., parallel = !is.null(attr(x, "recordings"))) {
+    dotdotdot <- attr(x, 'summarize_code')
+    
+    # make a copy
+    dotdotdot_chunk_agg <- dotdotdot
+    dotdotdot_collected_agg <- dotdotdot
+    
+    i = 1
+    for (a_call in dotdotdot) {
+      # obtain the function call name
+      func_call_str = paste0(deparse(a_call[[1]]), collapse = "")
+      
+      # parse(...) returns an expression, but I just want the sole symbol which
+      # can be extracted with [[1]]
+      func_call_chunk_agg = parse(text = paste0(func_call_str, "_df.chunk_agg.disk.frame"))[[1]]
+      # replace the function call with the chunk_agg_function
+      dotdotdot_chunk_agg[[i]][[1]] = func_call_chunk_agg
+      
+      func_call_collected_agg = paste0(func_call_str, "_df.collected_agg.disk.frame")
+      # replace the function call with the chunk_agg_function
+      dotdotdot_collected_agg[[i]] = parse(text = sprintf(
+        "%s(%s)",
+        func_call_collected_agg,
+        paste0(".disk.frame.tmp", i)
+      ))[[1]]
+      i = i + 1
+      # TODO extract global variables from here and store them in the global
+    }
+    
+    group_by_vars = attr(x, "group_by_cols")
+    
+    # figure out how many group by arguments there are
+    n_grp_args = length(group_by_vars)
+    
+    # generate a function call with as many arguments
+    x_as.disk.frame = x
+    class(x_as.disk.frame) = "disk.frame"
+    first_stage_code = eval(parse(
+      text = sprintf(
+        "quote(chunk_group_by(x_as.disk.frame, %s))",
+        paste0(rep_len("NULL", n_grp_args), collapse = ", ")
+      )
+    ))
+    
+    if (n_grp_args >= 1) {
+      for (i in 1:n_grp_args) {
+        first_stage_code[[i + 2]] = group_by_vars[[i]]
+      }
+    }
+    
+    # TODO add appropriate environment
+    tmp_df = eval(first_stage_code)
+    
+    n_summ_args = length(dotdotdot_chunk_agg)
+    
+    chunk_summ_code =
+      eval(parse(text = sprintf(
+        "quote(chunk_summarise(tmp_df, %s))",
+        paste0("NULL", 1:n_summ_args, collapse = ", ")
+      )))
+    
+    
+    chunk_summ_code_str = chunk_summ_code %>%
+      deparse %>%
+      paste0(collapse = "")
+    
+    for (i in 1:n_summ_args) {
+      lhs = sprintf(".disk.frame.tmp%d", i)
+      rhs = paste0(deparse(dotdotdot_chunk_agg[[i]]), collapse = "")
+      
+      tmp_code = paste0("NULL", i)
+      chunk_summ_code_str = gsub(
+        pattern = tmp_code,
+        sprintf("%s=list(%s)", lhs, rhs),
+        chunk_summ_code_str,
+        fixed = TRUE
+      )
+    }
+    
+    tmp2 = collect(eval(parse(text = chunk_summ_code_str)))
+    
+    second_stage_code = eval(parse(text = sprintf(
+      "quote(group_by(tmp2, %s))", paste0(rep_len("NULL", n_grp_args), collapse = ", ")
+    )))
+    
+    if (n_grp_args >= 1) {
+      for (i in 1:n_grp_args) {
+        second_stage_code[[i + 2]] = group_by_vars[[i]]
+      }
+    }
+    
+    tmp3 = eval(second_stage_code)
+    
+    n_summ2_args = length(dotdotdot_collected_agg)
+    # final stage of summary
+    chunk_summ2_code =
+      eval(parse(text = sprintf(
+        "quote(summarise(tmp3, %s))",
+        paste0(rep_len("NULL", n_summ2_args), collapse = ", ")
+      )))
+    
+    names_chunk_summ_code = names(dotdotdot_chunk_agg)
+    for (i in 1:n_summ_args) {
+      chunk_summ2_code[[i + 2]] = dotdotdot_collected_agg[[i]]
+    }
+    
+    tmp4 = eval(chunk_summ2_code)
+    
+    names_tmp4 = names(tmp4)
+    
+    orig_names = sapply(dotdotdot, function(code) {
+      code %>%
+        deparse %>%
+        paste0(collapse = "")
+    })
+    
+    
+    names(tmp4)[(n_grp_args + 1):length(names_tmp4)] = ifelse(names_chunk_summ_code ==
+                                                                "",
+                                                              orig_names,
+                                                              names_chunk_summ_code)
+    
+    return(tmp4)
+  }
diff --git a/R/csv2disk.frame.r b/R/csv2disk.frame.r
index d63ee0e2..83acdaf0 100644
--- a/R/csv2disk.frame.r
+++ b/R/csv2disk.frame.r
@@ -19,8 +19,7 @@
 #'   the highest compression ratio.
 #' @param overwrite Whether to overwrite the existing directory
 #' @param header Whether the files have header. Defaults to TRUE
-#' @param .progress A logical, for whether or not to print a progress bar for
-#'   multiprocess, multisession, and multicore plans. From {furrr}
+#' @param .progress A logical, for whether or not to show progress
 #' @param backend The CSV reader backend to choose: "data.table" or "readr". 
 #'   disk.frame does not have its own CSV reader. It uses either
 #'   data.table::fread or readr::read_delimited. It is worth noting that
@@ -66,20 +65,20 @@ csv_to_disk.frame <- function(infile, outdir = tempfile(fileext = ".df"), inmapf
   
   overwrite_check(outdir, overwrite)
   
-  # we need multiple backend because data.table has poor support for when the file is larger than RAM
+  # we need multiple backends because data.table has poor support for when the file is larger than RAM
   # https://github.com/Rdatatable/data.table/issues/3526
   # TODO detect these cases
   
   # user has requested chunk-wise reading but wants me to do it
   
   #if(is.null(in_chunk_size)) {
-    
+  
   #} else if(is.character(in_chunk_size) && in_chunk_size == "guess") {
-    
-    #library(bigreadr)
-    # system.time(wc_l <- R.utils::countLines(infile))
-    # system.time(infos_split <- split_file(infile, every_nlines = 1e7))
-    # file_parts <- get_split_files(infos_split)
+  
+  #library(bigreadr)
+  # system.time(wc_l <- R.utils::countLines(infile))
+  # system.time(infos_split <- split_file(infile, every_nlines = 1e7))
+  # file_parts <- get_split_files(infos_split)
    
   #} else
   if(is.numeric(in_chunk_size)) {
@@ -307,12 +306,10 @@ csv_to_disk.frame_data.table_backend <- function(infile, outdir = tempfile(filee
       message("")
     }
     
-    outdf_tmp = furrr::future_imap(infile, ~{
-      dotdotdotorigarg1 = c(dotdotdotorigarg, list(outdir = file.path(tempdir(), .y), infile=.x))
-      
-      pryr::do_call(csv_to_disk.frame_data.table_backend, dotdotdotorigarg1)
-    }, 
-      .progress = .progress)
+    outdf_tmp = future.apply::future_imap(1:length(infile), function(i) {
+      dotdotdotorigarg1 = c(dotdotdotorigarg, list(outdir = file.path(tempdir(), i), infile=infile[i]))
+      do.call(csv_to_disk.frame_data.table_backend, dotdotdotorigarg1)
+    })
     
     if(.progress) {
       message(paste("-- Converting CSVs to disk.frame -- Stage 1 or 2 took:", data.table::timetaken(pt)))
@@ -330,7 +327,6 @@ csv_to_disk.frame_data.table_backend <- function(infile, outdir = tempfile(filee
     outdf = rbindlist.disk.frame(outdf_tmp, outdir = outdir, by_chunk_id = TRUE, compress = compress, overwrite = overwrite, .progress = .progress)
     
     if(.progress) {
-      
       message(paste("Stage 2 of 2 took:", data.table::timetaken(pt2)))
       message(" ----------------------------------------------------- ")
       message(paste("Stage 1 & 2 in total took:", data.table::timetaken(pt)))
diff --git a/R/data.table.r b/R/data.table.r
index f0210535..0d12184f 100644
--- a/R/data.table.r
+++ b/R/data.table.r
@@ -18,29 +18,58 @@
 #' # clean up
 #' delete(cars.df)
 `[.disk.frame` <- function(df, ..., keep = NULL, rbind = TRUE, use.names = TRUE, fill = FALSE, idcol = NULL) {
+  message("data.table syntax for disk.frame may be moved to a separate package in the future")
 
   keep_for_future = keep
   
-  dotdotdot = substitute(...()) #this is an alist
+  code = substitute(chunk[...])
   
   # sometimes the arguments could be empty
   # in a recent version of globals that would cause a fail
   # to avoid the fail remove them from the test
-  dotdotdot_for_find_global = dotdotdot[!sapply(sapply(dotdotdot, as.character), function(x) all(unlist(x) == ""))]
+  #dotdotdot_for_find_global = dotdotdot[!sapply(sapply(dotdotdot, as.character), function(x) all(unlist(x) == ""))]
   
-  ag = globals::findGlobals(dotdotdot_for_find_global)
+  #ag = globals::findGlobals(dotdotdot_for_find_global)
   #ag = setdiff(ag, "") # "" can cause issues with future # this line no longer needed
   
-  res = future.apply::future_lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {
-  #lapply(get_chunk_ids(df, strip_extension = FALSE), function(chunk_id) {
-    chunk = get_chunk(df, chunk_id, keep = keep_for_future)
+  
+  # you need to use list otherwise the names will be gone
+  if (paste0(deparse(code), collapse="") == "chunk_fn(NULL)") {
+    globals_and_pkgs = future::getGlobalsAndPackages(expression(chunk_fn()))
+  } else {
+    globals_and_pkgs = future::getGlobalsAndPackages(code)
+  }
+  
+  
+  global_vars = globals_and_pkgs$globals
+  
+  env = parent.frame()
+  
+  done = identical(env, emptyenv()) || identical(env, globalenv())
+  
+  # keep adding global variables by moving up the environment chain
+  while(!done) {
+    tmp_globals_and_pkgs = future::getGlobalsAndPackages(code, envir = env)
+    new_global_vars = tmp_globals_and_pkgs$globals
+    for (name in setdiff(names(new_global_vars), names(global_vars))) {
+      global_vars[[name]] <- new_global_vars[[name]]
+    }
+    
+    done = identical(env, emptyenv()) || identical(env, globalenv())
+    env = parent.env(env)
+  }
+  
+  globals_and_pkgs$globals = global_vars
+  
+  res = future.apply::future_lapply(get_chunk_ids(df, full.names = TRUE), function(chunk_id) {
+  #res = lapply(get_chunk_ids(df, full.names = TRUE), function(chunk_id) {
+    chunk = get_chunk(df, chunk_id, full.names=TRUE, keep = keep_for_future)
     data.table::setDT(chunk)
-    expr <- quote(chunk)
-    expr <- c(expr, dotdotdot)
-    res <- do.call(`[`, expr)
+    res = eval(code, envir=globals_and_pkgs$globals)
     res
-  }, future.globals = c("df", "keep_for_future", "dotdotdot", ag), future.packages = c("data.table","disk.frame"),
-  future.seed=TRUE
+  }
+  , future.packages = c("data.table", globals_and_pkgs$packages),
+   future.seed=TRUE
   )
   
   if(rbind & all(sapply(res, function(x) "data.frame" %in% class(x)))) {
@@ -53,14 +82,6 @@
 }
 
 # Solutions from https://stackoverflow.com/questions/57122960/how-to-use-non-standard-evaluation-nse-to-evaluate-arguments-on-data-table?answertab=active#tab-top
-# `[.dd` <- function(x, ...) {
-#   code <- rlang::enexprs(...)
-#   lapply(x, function(dt) {
-#     ex <- rlang::expr(dt[!!!code])
-#     rlang::eval_tidy(ex)
-#   })
-# }
-# 
 # 
 # `[.dd` <- function(x,...) {
 #   a <- substitute(...()) #this is an alist
diff --git a/R/dplyr_verbs.r b/R/dplyr_verbs.r
index 6e6fa162..285c678f 100644
--- a/R/dplyr_verbs.r
+++ b/R/dplyr_verbs.r
@@ -25,14 +25,6 @@
 #' delete(cars.df)
 select.disk.frame <- create_chunk_mapper(dplyr::select)
 
-# comment out code; to be removed when it's no longer needed
-# select.disk.frame <- function(.data, ...) {
-#   quo_dotdotdot = rlang::enquos(...)
-#   cmap(.data, ~{
-#     code = rlang::quo(dplyr::select(.x, !!!quo_dotdotdot))
-#     rlang::eval_tidy(code)
-#   }, lazy = TRUE)
-# }
 
 #' @export
 #' @rdname dplyr_verbs
@@ -46,7 +38,6 @@ filter.disk.frame <- create_chunk_mapper(dplyr::filter)
 #' @export
 #' @rdname dplyr_verbs
 #' @importFrom future getGlobalsAndPackages
-#' @importFrom rlang eval_tidy quo enquos
 #' @importFrom dplyr mutate
 mutate.disk.frame <- create_chunk_mapper(dplyr::mutate)
 
diff --git a/R/foverlaps.disk.frame.r b/R/foverlaps.disk.frame.r
index 2ae7c706..657b8c65 100644
--- a/R/foverlaps.disk.frame.r
+++ b/R/foverlaps.disk.frame.r
@@ -84,7 +84,7 @@ foverlaps.disk.frame <- function(
       dotdotdot$x = data1
       dotdotdot$y = data2
       
-      data3 = pryr::do_call(foverlaps, dotdotdot)
+      data3 = do.call(foverlaps, dotdotdot)
       rm(data1); rm(data2); gc()
       outdir
       fst::write_fst(data3, glue::glue("{outdir}/{chunk_id}"), compress = compress)
diff --git a/R/full_join.r b/R/full_join.r
index 54dc2ba9..50ba772b 100644
--- a/R/full_join.r
+++ b/R/full_join.r
@@ -15,8 +15,8 @@ full_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
   if("data.frame" %in% class(y)) {
     # full join cannot be support for y in data.frame
     ncx = nchunks(x)
-    dy = shard(y, shardby = by, nchunks = ncx, overwrite = TRUE)
-    dx = hard_group_by(x, by = by, overwrite = TRUE)
+    dy = shard(y, shardby = by, nchunks = ncx, overwrite = FALSE)
+    dx = rechunk(x, shardby = by, outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
     return(full_join.disk.frame(dx, dy, by, copy=copy, outdir=outdir, merge_by_chunk_id = TRUE))
   } else if("disk.frame" %in% class(y)) {
     if(is.null(merge_by_chunk_id)) {
@@ -30,8 +30,8 @@ full_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
     ncy = nchunks(y)
     if (merge_by_chunk_id == FALSE) {
       warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
-      x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+      x = rechunk(x, by, nchunks = max(ncy,ncx), outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
+      y = rechunk(y, by, nchunks = max(ncy,ncx), outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
       return(full_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
     } else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
       res = cmap2(x, y, ~{
diff --git a/R/get_chunk.r b/R/get_chunk.r
index c4aa2f2e..01c06e61 100644
--- a/R/get_chunk.r
+++ b/R/get_chunk.r
@@ -69,6 +69,7 @@ get_chunk.disk.frame <- function(df, n, keep = NULL, full.names = FALSE, ...) {
     }
   }
   
+  
   # if the file you are looking for doesn't exist
   if (!fs::file_exists(filename)) {
     warning(glue("The chunk {filename} does not exist; returning an empty data.table"))
@@ -77,6 +78,7 @@ get_chunk.disk.frame <- function(df, n, keep = NULL, full.names = FALSE, ...) {
     return(notbl)
   }
 
+  
   if (is.null(recordings)) {
     if(typeof(keep)=="closure") {
       fst::read_fst(filename, as.data.table = TRUE,...)
diff --git a/R/hard_arrange.r b/R/hard_arrange.r
index f5ca5de5..ca8cee7e 100644
--- a/R/hard_arrange.r
+++ b/R/hard_arrange.r
@@ -1,67 +1,67 @@
-#' Perform a hard arrange
-#' @description
-#' A hard_arrange is a sort by that also reorganizes the chunks to ensure that
-#' every unique grouping of `by`` is in the same chunk. Or in other words, every
-#' row that share the same `by` value will end up in the same chunk.
-#' @param df a disk.frame
-#' @param ... grouping variables
-#' @param outdir the output directory
-#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)
-#' @param overwrite overwrite the out put directory
-#' @param add same as dplyr::arrange
-#' @param .drop same as dplyr::arrange
-#' @export
-#' @examples
-#' iris.df = as.disk.frame(iris, nchunks = 2)
+#' #' Perform a hard arrange
+#' #' @description
+#' #' A hard_arrange is a sort by that also reorganizes the chunks to ensure that
+#' #' every unique grouping of `by`` is in the same chunk. Or in other words, every
+#' #' row that share the same `by` value will end up in the same chunk.
+#' #' @param df a disk.frame
+#' #' @param ... grouping variables
+#' #' @param outdir the output directory
+#' #' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)
+#' #' @param overwrite overwrite the out put directory
+#' #' @param add same as dplyr::arrange
+#' #' @param .drop same as dplyr::arrange
+#' #' @export
+#' #' @examples
+#' #' iris.df = as.disk.frame(iris, nchunks = 2)
+#' #' 
+#' #' # arrange iris.df by specifies and ensure rows with the same specifies are in the same chunk
+#' #' iris_hard.df = hard_arrange(iris.df, Species)
+#' #' 
+#' #' get_chunk(iris_hard.df, 1)
+#' #' get_chunk(iris_hard.df, 2)
+#' #' 
+#' #' # clean up cars.df
+#' #' delete(iris.df)
+#' #' delete(iris_hard.df)
+#' hard_arrange <- function(df, ..., add = FALSE, .drop = FALSE) {
+#'   UseMethod("hard_arrange")
+#' }
 #' 
-#' # arrange iris.df by specifies and ensure rows with the same specifies are in the same chunk
-#' iris_hard.df = hard_arrange(iris.df, Species)
+#' #' @rdname hard_arrange
+#' #' @export
+#' #' @importFrom dplyr arrange
+#' hard_arrange.data.frame <- function(df, ...) {
+#'   dplyr::arrange(df, ...)
+#' }
 #' 
-#' get_chunk(iris_hard.df, 1)
-#' get_chunk(iris_hard.df, 2)
+#' #' @rdname hard_arrange
+#' #' @importFrom purrr map
+#' #' @export
+#' hard_arrange.disk.frame <- function(df, ..., outdir=tempfile("tmp_disk_frame_hard_arrange"), nchunks = disk.frame::nchunks(df), overwrite = TRUE) {
+#'   overwrite_check(outdir, overwrite)
+#'   
+#'   # Refer also to Dplyr arrange: https://github.com/tidyverse/dplyr/blob/master/src/arrange.cpp
+#'   q <- enquos(...)
+#'   is_sym <- sapply(q, rlang::quo_is_symbol)
+#'   arrange_codes <- sapply(q, rlang::as_label)
+#'   
+#'   # Check if desc...
+#'   is_desc <- substr(arrange_codes, 1, 5) == "desc("
+#'   
+#'   # If expr is a symbol from the data, just use it.
+#'   # Otherwise need to evaluate ... 
+#'   # (TODO - currently only support variables and desc in the data)
+#'   # Peels off "desc" from the original
+#'   vars <- sub(")", "", sub("desc(", "", arrange_codes, fixed=TRUE), fixed=TRUE)
 #' 
-#' # clean up cars.df
-#' delete(iris.df)
-#' delete(iris_hard.df)
-hard_arrange <- function(df, ..., add = FALSE, .drop = FALSE) {
-  UseMethod("hard_arrange")
-}
-
-#' @rdname hard_arrange
-#' @export
-#' @importFrom dplyr arrange
-hard_arrange.data.frame <- function(df, ...) {
-  dplyr::arrange(df, ...)
-}
-
-#' @rdname hard_arrange
-#' @importFrom purrr map
-#' @export
-hard_arrange.disk.frame <- function(df, ..., outdir=tempfile("tmp_disk_frame_hard_arrange"), nchunks = disk.frame::nchunks(df), overwrite = TRUE) {
-  overwrite_check(outdir, overwrite)
-  
-  # Refer also to Dplyr arrange: https://github.com/tidyverse/dplyr/blob/master/src/arrange.cpp
-  q <- enquos(...)
-  is_sym <- sapply(q, rlang::quo_is_symbol)
-  arrange_codes <- sapply(q, rlang::as_label)
-  
-  # Check if desc...
-  is_desc <- substr(arrange_codes, 1, 5) == "desc("
-  
-  # If expr is a symbol from the data, just use it.
-  # Otherwise need to evaluate ... 
-  # (TODO - currently only support variables and desc in the data)
-  # Peels off "desc" from the original
-  vars <- sub(")", "", sub("desc(", "", arrange_codes, fixed=TRUE), fixed=TRUE)
-
-  desc_vars <- vars[is_desc]
-  
-  if(!all(vars %in% colnames(df))){
-    stop(paste0("Expressions currently not supported. Columns not found in colnames:", vars[!vars %in% colnames(df)]))
-  }
-  
-  # Hard group by in a partially sorted way at the chunk level and then arrange within chunks
-  df %>% 
-    disk.frame::hard_group_by(vars, outdir=outdir, nchunks=nchunks, overwrite=overwrite, shardby_function="sort", desc_vars=desc_vars) %>%
-    chunk_arrange(...)
-}
\ No newline at end of file
+#'   desc_vars <- vars[is_desc]
+#'   
+#'   if(!all(vars %in% colnames(df))){
+#'     stop(paste0("Expressions currently not supported. Columns not found in colnames:", vars[!vars %in% colnames(df)]))
+#'   }
+#'   
+#'   # Hard group by in a partially sorted way at the chunk level and then arrange within chunks
+#'   df %>% 
+#'     disk.frame::hard_group_by(vars, outdir=outdir, nchunks=nchunks, overwrite=overwrite, shardby_function="sort", desc_vars=desc_vars) %>%
+#'     chunk_arrange(...)
+#' }
\ No newline at end of file
diff --git a/R/hard_group_by.r b/R/hard_group_by.r
index f0397cde..48228564 100644
--- a/R/hard_group_by.r
+++ b/R/hard_group_by.r
@@ -1,217 +1,217 @@
-#' Show a progress bar of the action being performed
-#' @importFrom utils txtProgressBar setTxtProgressBar
-#' @param df a disk.frame
-#' @noRd
-progressbar <- function(df) {
-  if(attr(df,"performing", exact=TRUE) == "hard_group_by") {
-    # create progress bar
-    
-    shardby = "acct_id"
-    #list.files(
-    fparent = attr(df,"parent", exact=TRUE)
-    
-    #tmp = file.path(fparent,".performing","inchunks")
-    tmp = "tmphardgroupby2"
-    
-    l = length(list.files(fparent))
-    pt_begin_split = proc.time()
-    doprog <- function(pt_from, sleep = 1) {
-      #tkpb = winProgressBar(title = sprintf("Hard Group By Stage 1(/2) - %s", shardby), label = "Checking completeness",
-      #                      min = 0, max = l*1.5, initial = 0, width = 500)
-      pb <- txtProgressBar(min = 0, max = l*1.5, style = 3)
-      
-      on.exit(close(pb))
-      # on.exit(close(tkpb))
-      while(length(list.files(file.path(tmp,l))) < l) {
-        wl = length(list.files(file.path(tmp,1:l)))/l
-        tt <- proc.time()[3] - pt_from[3]
-        #list.files(
-        avg_speed = tt/wl
-        pred_speed = avg_speed*(l-wl) + avg_speed*l/2
-        elapsed = round(tt/60,1)
-        
-        #setWinProgressBar(tkpb, wl, 
-        #                  title = sprintf("Hard Group By Stage 1(/2) - %s", shardby),
-        #                  label = sprintf("%.0f out of %d; avg speed %.2f mins; elapsed %.1f mins; another %.1f mins", wl,l, round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))
-        setTxtProgressBar(pb, length(list.files(file.path(tmp,l))), 
-                          title = sprintf("Group By - %s", shardby))
-        Sys.sleep(sleep)
-      }
-    }
-    doprog(pt_begin_split, 1)
-    
-    pt_begin_collate = proc.time()
-    doprog2 <- function(pt_from, sleep = 1) {
-      # tkpb = winProgressBar(title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating", shardby), label = "Checking completeness",
-                            # min = 0, max = l*1.5, initial = 0, width = 600)
-      pb <- txtProgressBar(min = 0, max = l*1.5, style = 3)
-      
-      on.exit(close(pb))
-      # on.exit(close(tkpb))
-      while(length(list.files("large_sorted")) < l) {
-        wl = length(list.files("large_sorted"))
-        tt <- proc.time()[3] - pt_from[3]
-        #list.files(
-        avg_speed = tt/wl
-        pred_speed = avg_speed*(l-wl)
-        elapsed = round(tt/60,1)
-        
-        # setWinProgressBar(tkpb, l + wl/2, 
-        #                   title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating -- %.0f out of %d chunks processed;", shardby, wl, l),
-        #                   label = sprintf("avg %.2f min/chunk; %.1f mins elapsed; %.1f mins remaining;", round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))
-        setTxtProgressBar(pb, length(list.files("large_sorted")), 
-                          title = sprintf("Hard Group By - %s", shardby))
-        Sys.sleep(sleep)
-      }
-    }
-    doprog2(pt_begin_collate, 1)
-  }
-}
-
-#' Perform a hard group
-#' @description
-#' A hard_group_by is a group by that also reorganizes the chunks to ensure that
-#' every unique grouping of `by`` is in the same chunk. Or in other words, every
-#' row that share the same `by` value will end up in the same chunk.
-#' @param df a disk.frame
-#' @param ... grouping variables
-#' @param outdir the output directory
-#' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)
-#' @param overwrite overwrite the out put directory
-#' @param .add same as dplyr::group_by
-#' @param .drop same as dplyr::group_by
-#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks
-#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.
-#' @param desc_vars for the "sort" shardby function, the variables to sort descending.
-#' @param sort_split_sample_size for the "sort" shardby function, if sort_splits is null, the number of rows to sample per chunk for random splits.
-#' @export
-#' @examples
-#' iris.df = as.disk.frame(iris, nchunks = 2)
+#' #' Show a progress bar of the action being performed
+#' #' @importFrom utils txtProgressBar setTxtProgressBar
+#' #' @param df a disk.frame
+#' #' @noRd
+#' progressbar <- function(df) {
+#'   if(attr(df,"performing", exact=TRUE) == "hard_group_by") {
+#'     # create progress bar
+#'     
+#'     shardby = "acct_id"
+#'     #list.files(
+#'     fparent = attr(df,"parent", exact=TRUE)
+#'     
+#'     #tmp = file.path(fparent,".performing","inchunks")
+#'     tmp = "tmphardgroupby2"
+#'     
+#'     l = length(list.files(fparent))
+#'     pt_begin_split = proc.time()
+#'     doprog <- function(pt_from, sleep = 1) {
+#'       #tkpb = winProgressBar(title = sprintf("Hard Group By Stage 1(/2) - %s", shardby), label = "Checking completeness",
+#'       #                      min = 0, max = l*1.5, initial = 0, width = 500)
+#'       pb <- txtProgressBar(min = 0, max = l*1.5, style = 3)
+#'       
+#'       on.exit(close(pb))
+#'       # on.exit(close(tkpb))
+#'       while(length(list.files(file.path(tmp,l))) < l) {
+#'         wl = length(list.files(file.path(tmp,1:l)))/l
+#'         tt <- proc.time()[3] - pt_from[3]
+#'         #list.files(
+#'         avg_speed = tt/wl
+#'         pred_speed = avg_speed*(l-wl) + avg_speed*l/2
+#'         elapsed = round(tt/60,1)
+#'         
+#'         #setWinProgressBar(tkpb, wl, 
+#'         #                  title = sprintf("Hard Group By Stage 1(/2) - %s", shardby),
+#'         #                  label = sprintf("%.0f out of %d; avg speed %.2f mins; elapsed %.1f mins; another %.1f mins", wl,l, round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))
+#'         setTxtProgressBar(pb, length(list.files(file.path(tmp,l))), 
+#'                           title = sprintf("Group By - %s", shardby))
+#'         Sys.sleep(sleep)
+#'       }
+#'     }
+#'     doprog(pt_begin_split, 1)
+#'     
+#'     pt_begin_collate = proc.time()
+#'     doprog2 <- function(pt_from, sleep = 1) {
+#'       # tkpb = winProgressBar(title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating", shardby), label = "Checking completeness",
+#'                             # min = 0, max = l*1.5, initial = 0, width = 600)
+#'       pb <- txtProgressBar(min = 0, max = l*1.5, style = 3)
+#'       
+#'       on.exit(close(pb))
+#'       # on.exit(close(tkpb))
+#'       while(length(list.files("large_sorted")) < l) {
+#'         wl = length(list.files("large_sorted"))
+#'         tt <- proc.time()[3] - pt_from[3]
+#'         #list.files(
+#'         avg_speed = tt/wl
+#'         pred_speed = avg_speed*(l-wl)
+#'         elapsed = round(tt/60,1)
+#'         
+#'         # setWinProgressBar(tkpb, l + wl/2, 
+#'         #                   title = sprintf("Hard Group By - %s -- Stage 2 (of 2) collating -- %.0f out of %d chunks processed;", shardby, wl, l),
+#'         #                   label = sprintf("avg %.2f min/chunk; %.1f mins elapsed; %.1f mins remaining;", round(avg_speed/60,2), elapsed, round(pred_speed/60,2)))
+#'         setTxtProgressBar(pb, length(list.files("large_sorted")), 
+#'                           title = sprintf("Hard Group By - %s", shardby))
+#'         Sys.sleep(sleep)
+#'       }
+#'     }
+#'     doprog2(pt_begin_collate, 1)
+#'   }
+#' }
 #' 
-#' # group_by iris.df by specifies and ensure rows with the same specifies are in the same chunk
-#' iris_hard.df = hard_group_by(iris.df, Species)
+#' #' Perform a hard group
+#' #' @description
+#' #' A hard_group_by is a group by that also reorganizes the chunks to ensure that
+#' #' every unique grouping of `by`` is in the same chunk. Or in other words, every
+#' #' row that share the same `by` value will end up in the same chunk.
+#' #' @param df a disk.frame
+#' #' @param ... grouping variables
+#' #' @param outdir the output directory
+#' #' @param nchunks The number of chunks in the output. Defaults = nchunks.disk.frame(df)
+#' #' @param overwrite overwrite the out put directory
+#' #' @param .add same as dplyr::group_by
+#' #' @param .drop same as dplyr::group_by
+#' #' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks
+#' #' @param sort_splits for the "sort" shardby function, a dataframe with the split values.
+#' #' @param desc_vars for the "sort" shardby function, the variables to sort descending.
+#' #' @param sort_split_sample_size for the "sort" shardby function, if sort_splits is null, the number of rows to sample per chunk for random splits.
+#' #' @export
+#' #' @examples
+#' #' iris.df = as.disk.frame(iris, nchunks = 2)
+#' #' 
+#' #' # group_by iris.df by specifies and ensure rows with the same specifies are in the same chunk
+#' #' iris_hard.df = hard_group_by(iris.df, Species)
+#' #' 
+#' #' get_chunk(iris_hard.df, 1)
+#' #' get_chunk(iris_hard.df, 2)
+#' #' 
+#' #' # clean up cars.df
+#' #' delete(iris.df)
+#' #' delete(iris_hard.df)
+#' hard_group_by <- function(df, ..., .add = FALSE, .drop = FALSE) {
+#'   UseMethod("hard_group_by")
+#' }
 #' 
-#' get_chunk(iris_hard.df, 1)
-#' get_chunk(iris_hard.df, 2)
+#' #' @rdname hard_group_by
+#' #' @export
+#' #' @importFrom dplyr group_by
+#' hard_group_by.data.frame <- function(df, ..., .add = FALSE, .drop = FALSE) {
+#'   dplyr::group_by(df, ..., .add = FALSE, .drop = FALSE)
+#' }
 #' 
-#' # clean up cars.df
-#' delete(iris.df)
-#' delete(iris_hard.df)
-hard_group_by <- function(df, ..., .add = FALSE, .drop = FALSE) {
-  UseMethod("hard_group_by")
-}
-
-#' @rdname hard_group_by
-#' @export
-#' @importFrom dplyr group_by
-hard_group_by.data.frame <- function(df, ..., .add = FALSE, .drop = FALSE) {
-  dplyr::group_by(df, ..., .add = FALSE, .drop = FALSE)
-}
-
-#' @rdname hard_group_by
-#' @importFrom purrr map
-#' @export
-hard_group_by.disk.frame <- function(
-    df, 
-    ..., 
-    outdir=tempfile("tmp_disk_frame_hard_group_by"), 
-    nchunks = disk.frame::nchunks(df), 
-    overwrite = TRUE, 
-    shardby_function="hash", 
-    sort_splits=NULL, 
-    desc_vars=NULL, 
-    sort_split_sample_size=100
-  ) {
-  overwrite_check(outdir, overwrite)
-  
-  ff = list.files(attr(df, "path"))
-  stopifnot(shardby_function %in% c("hash", "sort"))
-  
-  if (shardby_function == "sort" && is.null(sort_splits)){
-    # Sample enough per chunk to generate reasonable splits
-    sample_size_per_chunk = ceiling(nchunks / disk.frame::nchunks(df)) * sort_split_sample_size
-    
-    # Sample and sort
-    sort_splits_sample <- cmap(df, dplyr::sample_n, size=sample_size_per_chunk, replace=TRUE) %>% 
-      select(...) %>%
-      collect()
-    
-    # NSE
-    tryCatch({
-      sort_splits_sample <- sort_splits_sample %>%
-        arrange(!!!syms(...))
-    }, error = function(e) {
-      sort_splits_sample <- sort_splits_sample %>%
-        arrange(...)
-    })
-    
-    # If 100 chunks, this return get 99 splits based on percentiles.
-    ntiles <- round((1:(nchunks-1)) * (nrow(sort_splits_sample) / (nchunks)))
-    
-    # Get splits. May lead to less than nchunks if duplicates are selected.
-    sort_splits <- sort_splits_sample %>% 
-      dplyr::slice(ntiles) %>%
-      distinct()
-  }
-  
-  # test if the unlist it will error
-  
-  tryCatch({
-    # This will return the variable names
-    
-    # TODO use better ways to do NSE
-    # the below will fail if indeed ... can not be list-ed
-    # there should be a better way to do this
-    by <- unlist(list(...))
-    
-    # shard and create temporary diskframes
-    tmp_df  = cmap(df, function(df1) {
-      tmpdir = tempfile()
-      shard(df1, shardby = by, nchunks = nchunks, outdir = tmpdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars)
-    }, lazy = FALSE)
-    
-    
-    # now rbindlist
-    res = rbindlist.disk.frame(tmp_df, outdir=outdir, overwrite = overwrite)
-    
-    # clean up the tmp dir
-    purrr::walk(tmp_df, ~{
-      fs::dir_delete(attr(.x, "path", exact=TRUE))
-    })
-    
-
-    res1 <- NULL
-    if(typeof(by) == "character") {
-      eval(parse(text = glue::glue('res1 = chunk_group_by(res, {paste(by,collapse=",")})')))
-    } else if(length(by) == 1) {
-      res1 = res %>% dplyr::group_by({{by}}) 
-    } else {
-      eval(parse(text = glue::glue('res1 = chunk_group_by(res, {paste(by,collapse=",")})')))
-    }
-    
-    res1
-  }, error = function(e) {
-    # message(e)
-    # This will return the variable names
-    by = rlang::enquos(...) %>% 
-      substr(2, nchar(.))
-    
-    # shard and create temporary diskframes
-    tmp_df  = cmap(df, function(df1) {
-      tmpdir = tempfile()
-      shard(df1, shardby = by, nchunks = nchunks, outdir = tmpdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars)
-    }, lazy = FALSE)
-    
-    # now rbindlist
-    res = rbindlist.disk.frame(tmp_df, outdir=outdir, overwrite = overwrite)
-    
-    # clean up the tmp dir
-    purrr::walk(tmp_df, ~{
-      fs::dir_delete(attr(.x, "path", exact=TRUE))
-    })
-    
-    res1 = res %>% chunk_group_by(!!!syms(by))
-    
-    res1
-  })
-}
+#' #' @rdname hard_group_by
+#' #' @importFrom purrr map
+#' #' @export
+#' hard_group_by.disk.frame <- function(
+#'     df, 
+#'     ..., 
+#'     outdir=tempfile("tmp_disk_frame_hard_group_by"), 
+#'     nchunks = disk.frame::nchunks(df), 
+#'     overwrite = TRUE, 
+#'     shardby_function="hash", 
+#'     sort_splits=NULL, 
+#'     desc_vars=NULL, 
+#'     sort_split_sample_size=100
+#'   ) {
+#'   overwrite_check(outdir, overwrite)
+#'   
+#'   ff = list.files(attr(df, "path"))
+#'   stopifnot(shardby_function %in% c("hash", "sort"))
+#'   
+#'   if (shardby_function == "sort" && is.null(sort_splits)){
+#'     # Sample enough per chunk to generate reasonable splits
+#'     sample_size_per_chunk = ceiling(nchunks / disk.frame::nchunks(df)) * sort_split_sample_size
+#'     
+#'     # Sample and sort
+#'     sort_splits_sample <- cmap(df, dplyr::sample_n, size=sample_size_per_chunk, replace=TRUE) %>% 
+#'       select(...) %>%
+#'       collect()
+#'     
+#'     # NSE
+#'     tryCatch({
+#'       sort_splits_sample <- sort_splits_sample %>%
+#'         arrange(!!!syms(...))
+#'     }, error = function(e) {
+#'       sort_splits_sample <- sort_splits_sample %>%
+#'         arrange(...)
+#'     })
+#'     
+#'     # If 100 chunks, this return get 99 splits based on percentiles.
+#'     ntiles <- round((1:(nchunks-1)) * (nrow(sort_splits_sample) / (nchunks)))
+#'     
+#'     # Get splits. May lead to less than nchunks if duplicates are selected.
+#'     sort_splits <- sort_splits_sample %>% 
+#'       dplyr::slice(ntiles) %>%
+#'       distinct()
+#'   }
+#'   
+#'   # test if the unlist it will error
+#'   
+#'   tryCatch({
+#'     # This will return the variable names
+#'     
+#'     # TODO use better ways to do NSE
+#'     # the below will fail if indeed ... can not be list-ed
+#'     # there should be a better way to do this
+#'     by <- unlist(list(...))
+#'     
+#'     # shard and create temporary diskframes
+#'     tmp_df  = cmap(df, function(df1) {
+#'       tmpdir = tempfile()
+#'       shard(df1, shardby = by, nchunks = nchunks, outdir = tmpdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars)
+#'     }, lazy = FALSE)
+#'     
+#'     
+#'     # now rbindlist
+#'     res = rbindlist.disk.frame(tmp_df, outdir=outdir, overwrite = overwrite)
+#'     
+#'     # clean up the tmp dir
+#'     purrr::walk(tmp_df, ~{
+#'       fs::dir_delete(attr(.x, "path", exact=TRUE))
+#'     })
+#'     
+#' 
+#'     res1 <- NULL
+#'     if(typeof(by) == "character") {
+#'       eval(parse(text = glue::glue('res1 = chunk_group_by(res, {paste(by,collapse=",")})')))
+#'     } else if(length(by) == 1) {
+#'       res1 = res %>% dplyr::group_by({{by}}) 
+#'     } else {
+#'       eval(parse(text = glue::glue('res1 = chunk_group_by(res, {paste(by,collapse=",")})')))
+#'     }
+#'     
+#'     res1
+#'   }, error = function(e) {
+#'     # message(e)
+#'     # This will return the variable names
+#'     by = rlang::enquos(...) %>% 
+#'       substr(2, nchar(.))
+#'     
+#'     # shard and create temporary diskframes
+#'     tmp_df  = cmap(df, function(df1) {
+#'       tmpdir = tempfile()
+#'       shard(df1, shardby = by, nchunks = nchunks, outdir = tmpdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars)
+#'     }, lazy = FALSE)
+#'     
+#'     # now rbindlist
+#'     res = rbindlist.disk.frame(tmp_df, outdir=outdir, overwrite = overwrite)
+#'     
+#'     # clean up the tmp dir
+#'     purrr::walk(tmp_df, ~{
+#'       fs::dir_delete(attr(.x, "path", exact=TRUE))
+#'     })
+#'     
+#'     res1 = res %>% chunk_group_by(!!!syms(by))
+#'     
+#'     res1
+#'   })
+#' }
diff --git a/R/inner_join.r b/R/inner_join.r
index 545136f9..5699e71b 100644
--- a/R/inner_join.r
+++ b/R/inner_join.r
@@ -8,7 +8,7 @@
 #' # clean up cars.df
 #' delete(cars.df)
 #' delete(join.df)
-inner_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfile("tmp_disk_frame_inner_join"), merge_by_chunk_id = NULL, overwrite = TRUE, .progress = FALSE) {
+inner_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, suffix=c(".x", ".y"), ..., keep=FALSE, outdir = tempfile("tmp_disk_frame_inner_join"), merge_by_chunk_id = NULL, overwrite = TRUE, .progress = FALSE) {
   stopifnot("disk.frame" %in% class(x))
   
   overwrite_check(outdir, overwrite)
@@ -24,10 +24,8 @@ inner_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempf
   }
   
   if("data.frame" %in% class(y)) {
-    quo_dotdotdot = enquos(...)
     res = cmap_dfr(x, ~{
-      code = quo(inner_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
-      rlang::eval_tidy(code)
+      inner_join(.x, y, by = by, copy = copy, suffix=suffix, ..., keep=keep)
     }, .progress = .progress)
     return(res)
   } else if("disk.frame" %in% class(y)) {
@@ -41,22 +39,18 @@ inner_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempf
     ncx = nchunks(x)
     ncy = nchunks(y)
     if (merge_by_chunk_id == FALSE) {
-      x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      return(inner_join.disk.frame(x, y, by, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite))
+      x = rechunk(x, shardby=by, nchunks = max(ncy,ncx), outdir = tempfile(fileext = ".df"), overwrite = FALSE)
+      y = rechunk(y, shardby=by, nchunks = max(ncy,ncx), outdir = tempfile(fileext = ".df"), overwrite = FALSE)
+      return(inner_join.disk.frame(x, y, by, copy=copy, suffix = suffix, ..., keep=keep, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite))
     } else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
-      dotdotdot <- list(...)
-      
       res = cmap2.disk.frame(x, y, ~{
         if(is.null(.y)) {
           return(data.table())
         } else if (is.null(.x)) {
           return(data.table())
         }
-        #inner_join(.x, .y, by = by, copy = copy, ..., overwrite = overwrite)
-        lij = purrr::lift(dplyr::inner_join)
-        lij(c(list(x = .x, y = .y, by = by, copy = copy), dotdotdot))
-      }, outdir = outdir, .progress = .progress)
+        inner_join(.x, .y, by = by, copy = copy, suffix = suffix, ..., keep=keep)
+      }, outdir = outdir, .progress = .progress, overwrite = overwrite)
       return(res)
     } else {
       # TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine
diff --git a/R/left_join.r b/R/left_join.r
index b4835da9..e3b810b8 100644
--- a/R/left_join.r
+++ b/R/left_join.r
@@ -28,11 +28,10 @@ left_join.disk.frame = function(x, y, by=NULL, copy=FALSE, suffix=c(".x", ".y"),
     ncy = nchunks(y)
     if (merge_by_chunk_id == FALSE) {
       warning("`merge_by_chunk_id = FALSE`. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making `y` a data.frame or set merge_by_chunk_id = TRUE for better performance.")
-      x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+      x = rechunk(x, nchunks = max(ncy, ncx), shardby = by, outdir=tempfile(), overwrite = FALSE)
+      y = rechunk(x, nchunks = max(ncy, ncx), shardby = by, outdir=tempfile(), overwrite = FALSE)
       return(left_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
     } else if(merge_by_chunk_id == TRUE) {
-      #} else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
       dotdotdot = list(...)
       res = cmap2.disk.frame(x, y, ~{
         if(is.null(.y)) {
@@ -40,9 +39,9 @@ left_join.disk.frame = function(x, y, by=NULL, copy=FALSE, suffix=c(".x", ".y"),
         } else if (is.null(.x)) {
           return(data.table())
         }
-        llj = purrr::lift(dplyr::left_join)
-        #left_join(.x, .y, by = by, copy = copy, ...)
-        llj(c(list(x=.x, y =.y, by = by, copy = copy), dotdotdot))
+        left_join(.x, .y, by = by, copy = copy, suffix=suffix, ..., keep=keep)
+        #llj = purrr::lift(dplyr::left_join)
+        #llj(c(list(x=.x, y =.y, by = by, copy = copy), dotdotdot))
       }, outdir = outdir)
       return(res)
     } else {
@@ -51,59 +50,4 @@ left_join.disk.frame = function(x, y, by=NULL, copy=FALSE, suffix=c(".x", ".y"),
     }
   }
 }
-  
-# 
-# left_join.disk.frame_backup <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfile("tmp_disk_frame_left_join"), merge_by_chunk_id = FALSE, overwrite = TRUE, .progress = FALSE) {
-#   
-#   stopifnot("disk.frame" %in% class(x))
-#   
-#   overwrite_check(outdir, overwrite)
-#   
-#   if("data.frame" %in% class(y)) {
-#     # note that x is named .data in the lazy evaluation
-#     quo_dotdotdot = enquos(...)
-#     
-#     browser()
-#     cmap(x, ~{
-#       left_join(.x, y, by = by, copy = copy, ...)
-#     }, lazy = FALSE, outdir = outdir, overwrite=TRUE)
-#     
-#     cmap_dfr(x, ~{
-#       code = quo(left_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
-#       rlang::eval_tidy(code)
-#     }, .progress = .progress)
-#   } else if("disk.frame" %in% class(y)) {
-#     if(is.null(merge_by_chunk_id)) {
-#       stop("both `x` and `y` are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly")
-#     }
-#     if(is.null(by)) {
-#       by <- intersect(names(x), names(y))
-#     }
-#     
-#     ncx = nchunks(x)
-#     ncy = nchunks(y)
-#     if (merge_by_chunk_id == FALSE) {
-#       warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
-#       x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-#       y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-#       return(left_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
-#     } else if(merge_by_chunk_id == TRUE) {
-#     #} else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
-#       dotdotdot = list(...)
-#       res = cmap2.disk.frame(x, y, ~{
-#         if(is.null(.y)) {
-#           return(.x)
-#         } else if (is.null(.x)) {
-#           return(data.table())
-#         }
-#         llj = purrr::lift(dplyr::left_join)
-#         #left_join(.x, .y, by = by, copy = copy, ...)
-#         llj(c(list(x=.x, y =.y, by = by, copy = copy), dotdotdot))
-#       }, outdir = outdir)
-#       return(res)
-#     } else {
-#       # TODO if the shardkey are the same and only the shardchunks are different then just shard again on one of them is fine
-#       stop("merge_by_chunk_id is TRUE but shardkey(x) does NOT equal to shardkey(y). You may want to perform a hard_group_by() on both x and/or y or set merge_by_chunk_id = FALSE")
-#     }
-#   }
-# }
+  
\ No newline at end of file
diff --git a/R/map2.r b/R/map2.r
index 97062b9e..22633241 100644
--- a/R/map2.r
+++ b/R/map2.r
@@ -35,10 +35,8 @@ cmap2.disk.frame <- function(.x, .y, .f, ..., outdir = tempfile(fileext = ".df")
     stop(sprintf("running %s : the .x argument must be a disk.frame", code))
   } 
   
-  
   .f = purrr::as_mapper(.f)
   
-  
   if("disk.frame" %in% class(.y)) {
     fs::dir_create(outdir)
     
@@ -49,8 +47,6 @@ cmap2.disk.frame <- function(.x, .y, .f, ..., outdir = tempfile(fileext = ".df")
     yc[,yid:=get_chunk_ids(.y, full.names = TRUE)]
     
     xyc = merge(xc, yc, by="cid", all = TRUE, allow.cartesian = TRUE)
-    
-    ddd = list(...)
     # apply the functions
     
     future.apply::future_mapply(function(xid, yid, outid) {
@@ -61,11 +57,10 @@ cmap2.disk.frame <- function(.x, .y, .f, ..., outdir = tempfile(fileext = ".df")
       if(base::nrow(xych) > 0) {
         fst::write_fst(xych, file.path(outdir, paste0(outid,".fst")))
       } else {
-        warning(glue::glue("one of the chunks, {xid}, is empty"))
+        warning(sprintf("one of the chunks, %s, is empty", xid))
       }
       NULL
-    }
-    ,xyc$xid, xyc$yid, xyc$cid # together with mapply
+    }, xyc$xid, xyc$yid, xyc$cid # together with mapply
     , future.seed=NULL
     )
     
@@ -75,13 +70,12 @@ cmap2.disk.frame <- function(.x, .y, .f, ..., outdir = tempfile(fileext = ".df")
     warning("in cmap2(.x,.y,...) the .y is not a disk.frame, so returning a list instead of a disk.frame")
     
     f_for_passing = force(.f)
-    ddd = list(...)
     tmp_disk.frame = force(.x)
-    res = furrr::future_map2(get_chunk_ids(tmp_disk.frame, full.names = TRUE), .y, function(xs, ys) {
-      ddd = c(list(get_chunk(tmp_disk.frame, xs, full.names = TRUE), ys), ddd)
-      
-      pryr::do_call(f_for_passing, ddd)
-    })
+    res = future.apply::future_mapply(function(xs, ys, ...) {
+      ddd = c(list(get_chunk(tmp_disk.frame, xs, full.names = TRUE), ys), ...)
+      do.call(f_for_passing, ddd)
+    }, get_chunk_ids(tmp_disk.frame, full.names = TRUE), .y, ..., SIMPLIFY=FALSE, future.seed = TRUE)
+    
     
     return(res)
   }
diff --git a/R/one-stage-verbs.R b/R/one-stage-verbs.R
index 3d3d41ff..27f62f2f 100644
--- a/R/one-stage-verbs.R
+++ b/R/one-stage-verbs.R
@@ -209,26 +209,20 @@ IQR_df.collected_agg.disk.frame <- function(listx, ...) {
 #' @rdname group_by
 #' @export
 summarise.grouped_disk.frame <- function(.data, ...) {
-  ca_code = generate_summ_code(...)
+  # get all components of the summarise
+  dotdotdot = rlang::enexprs(...)
   
-  if(is.null(names(ca_code))) {
-    return(eval(parse(text = glue::glue(".data %>% {rlang::as_label(ca_code)}"))))
-  } else if("chunk_summ_code" %in% names(ca_code)) {
-    chunk_summ_code = ca_code$chunk_summ_code
-    agg_summ_code = ca_code$agg_summ_code
-    
-    # get the by variables
-    group_by_cols = purrr::map_chr(attr(.data, "group_by_cols", exact=TRUE), ~{deparse(.x)})
-    
-    # generate full code
-    code_to_run = glue::glue("chunk_group_by({paste0(group_by_cols, collapse=',')}) %>% chunk_summarize({chunk_summ_code}) %>% collect %>% group_by({paste0(group_by_cols, collapse=',')}) %>% summarize({agg_summ_code})")
-    
-    class(.data) <- c("summarized_disk.frame", "disk.frame")
-    attr(.data, "summarize_code") = code_to_run
-    return(.data)
-  } else {
-    stop("something's wrong mate")
+  # convert any quosure to labels
+  for (i in seq_along(dotdotdot)) {
+    if("quosure" %in% class(dotdotdot[[i]])) {
+      dotdotdot[[i]] <- rlang::sym(rlang::as_label(dotdotdot[[i]]))
+    }
   }
+  
+  class(.data) <- c("summarized_disk.frame", "disk.frame")
+  attr(.data, "summarize_code") = dotdotdot
+  
+  return(.data)
 }
 
 #' @export
@@ -247,149 +241,49 @@ summarize.grouped_disk.frame = summarise.grouped_disk.frame
 #' @param .drop from dplyr
 #' @param ... same as the dplyr::group_by
 #' @importFrom dplyr group_by_drop_default
+#' @importFrom rlang enexpr
 #' @export
 #' @rdname group_by
 # learning from https://docs.dask.org/en/latest/dataframe-groupby.html
-group_by.disk.frame <- function(.data, ..., .add = FALSE, .drop = stop(".drop not yet supported")) {
+group_by.disk.frame <- function(.data, ..., .add = FALSE, .drop = stop("disk.frame does not support `.drop` in `group_by` at this stage")) {
+  
   class(.data) <- c("grouped_disk.frame", "disk.frame")
-  attr(.data, "group_by_cols") = substitute(list(...))
+  
+  # using rlang is a neccesary evil here as I need to deal with !!! that is supported by group_by etc
+  group_by_cols = rlang::enexprs(...)
+  
+  # convert any quosure to labels
+  for (i in seq_along(group_by_cols)) {
+    if("quosure" %in% class(group_by_cols[[i]])) {
+      group_by_cols[[i]] <- rlang::sym(rlang::as_label(group_by_cols[[i]]))
+    }
+  }
+  
+  
+  attr(.data, "group_by_cols") = group_by_cols
+  
   .data
 }
 
+
 #' @export
 #' @importFrom dplyr summarize
 #' @rdname group_by
 summarize.disk.frame <- function(.data, ...) {
+  # get all components of the summarise
+  dotdotdot = rlang::enexprs(...)
   
+  # convert any quosure to labels
+  for (i in seq_along(dotdotdot)) {
+    if("quosure" %in% class(dotdotdot[[i]])) {
+      dotdotdot[[i]] <- rlang::sym(rlang::as_label(dotdotdot[[i]]))
+    }
+  }
   
-  ca_code = generate_summ_code(...)
-  
-  if(is.null(names(ca_code))) {
-    return(eval(parse(text = glue::glue(".data %>% {rlang::as_label(ca_code)}"))))
-  } else if("chunk_summ_code" %in% names(ca_code)) {
-    chunk_summ_code = ca_code$chunk_summ_code
-    agg_summ_code = ca_code$agg_summ_code
-    
-    # generate full code
-    code_to_run = glue::glue("chunk_summarize({chunk_summ_code}) %>% collect %>% summarize({agg_summ_code})")
-    
-    class(.data) <- c("summarized_disk.frame", "disk.frame")
-    attr(.data, "summarize_code") = code_to_run
-    return(.data )
-  } else {
-    stop("something's wrong")
-  } 
-}
-n_df.chunk_agg.disk.frame
-#' Helper function to generate summarization code
-#' It basically takes something like summarize(tot = sum(1)) and turns it into 
-#' chunk_summarize(res1 = sum_df.chunk_agg.disk.frame(1)) %>% collect
-#' summarize(tot = sum_df.collected_agg.disk.frame(1))
-#' @importFrom data.table setDT setkey
-#' @importFrom utils methods
-#' @noRd
-generate_summ_code <- function(...) {
-  browser()
-  code1 = substitute(chunk_summarize(...))
-  code2 = glue::glue("substitute({deparse(code1)}, list(sum = quote(sum_df.chunk_agg.disk.frame)))")
-  chunk_agg_code = paste0(deparse(eval(parse(text=code2))), collapse="")
-  
-  code1 = substitute(summarize(...))
-  code2 = glue::glue("substitute({deparse(code1)}, list(sum = quote(sum_df.collected_agg.disk.frame)))")
-  collected_agg_code = paste0(deparse(eval(parse(text=code2))), collapse="")
-  
-  code = substitute(list(...))
-  
-  getParseData(parse(text = deparse(code), keep.source = TRUE), includeText = TRUE)
-  
-  
-  summ_code_quosure = eval(parse(text = code_to_expand))
-  #print(summ_code_quosure)
-  
-  # ZJ: 
-  # try the traditional route which can't deal with !!!, so if this fails then try the !!! route
-  tryCatch({
-    code = substitute(list(...))[-1]
-    # print("hehe")
-    # print(code)
-    expr_id = 0
-    temp_varn = 0
-    
-    list_of_chunk_agg_fns <- as.character(utils::methods(class = "chunk_agg.disk.frame"))
-    list_of_collected_agg_fns <- as.character(utils::methods(class = "collected_agg.disk.frame"))
-    # browser()
-    # generate the chunk_summarize_code
-    summarize_code = purrr::map_dfr(code, ~{
-      # print("raw code")
-      # print(.x)
-      expr_id <<- expr_id  + 1
-      # parse the function into table form for easy interrogration
-      # The keep.source = TRUE options seems necessary to keep it working in Rscript mode
-      gpd = getParseData(parse(text = deparse(.x), keep.source = TRUE), includeText = TRUE); 
-      # print("raw table")
-      # print(deparse(.x))
-      # print(gpd)
-      grp_funcs = gpd %>% filter(token == "SYMBOL_FUNCTION_CALL") %>% select(text) %>% pull
-      grp_funcs = grp_funcs %>% paste0("_df")
-      
-      # search in the space to find functions name `fn`.chunk_agg.disk.frame
-      # only allow one such functions for now TODO improve it
-      num_of_chunk_functions = sum(sapply(unique(grp_funcs), function(x) exists(paste0(x, ".chunk_agg.disk.frame"))))
-      num_of_collected_functions= sum(sapply(unique(grp_funcs), function(x) exists(paste0(x, ".collected_agg.disk.frame"))))
-      
-      # the number chunk and aggregation functions must match
-      stopifnot(num_of_chunk_functions == num_of_collected_functions)
-      
-      # keep only grp_functions
-      grp_funcs= grp_funcs[sapply(grp_funcs, function(x) exists(paste0(x, ".chunk_agg.disk.frame")))]
-      
-      if(num_of_chunk_functions == 0) {
-        stop(sprintf("There must be at least one summarization function in %s", deparse(.x)))
-      } else if (num_of_chunk_functions > 1) {
-        stop(sprintf("Two or more summarisation functions are detected in \n\n```\n%s\n```\n\nThese are currently not supported by {disk.frame} at the moment \n    * Nestling (like mean(sum(x) + y)) or \n    * combinations (like sum(x) + mean(x))\n\nIf you want this implemented, please leave a comment or upvote at: https://github.com/xiaodaigh/disk.frame/issues/228 \n\n", deparse(.x)))
-      }
-      
-      # check to see if the mean is only two from parent 0, otherwise it would a statement in the form of 1 + mean(x)
-      # which isn't supported
-      data.table::setDT(gpd)
-      data.table::setkey(gpd, parent)
-      if (gpd[id == gpd[id == gpd[(paste0(text,"_df") == grp_funcs) & (token == "SYMBOL_FUNCTION_CALL"), parent], parent], parent] != 0) {
-        stop(sprintf("Combining summarization with other operations \n\n```\n%s\n```\n\nThese are currently not supported by {disk.frame} at the moment \n    * combinations (like sum(x) + 1)\n* combinations (like list(sum(x)))\n\nIf you want this implemented, please leave a comment or upvote at: https://github.com/xiaodaigh/disk.frame/issues/228 \n\n", deparse(.x)))
-      }
-      
-      temp_varn <<- temp_varn + 1
-      grp_funcs_wo_df = sapply(grp_funcs, function(grp_func) substr(grp_func, 1, nchar(grp_func)-3))
-      
-      tmpcode = deparse(evalparseglue("substitute({deparse(.x)}, list({grp_funcs_wo_df} = quote({grp_funcs}.chunk_agg.disk.frame)))")) %>% paste0(collapse = " ")
-      
-      chunk_code = data.frame(assign_to = as.character(glue::glue("tmp{temp_varn}")), expr = tmpcode, stringsAsFactors = FALSE)
-      
-      chunk_code$orig_code = deparse(.x)
-      chunk_code$expr_id = expr_id
-      chunk_code$grp_fn = grp_funcs
-      chunk_code$name = ifelse(is.null(names(code[expr_id])), "", names(code[expr_id]))
-      
-      # create the aggregation code
-      chunk_code$agg_expr = as.character(glue::glue("{grp_funcs}.collected_agg.disk.frame({paste0(chunk_code$assign_to, collapse=', ')})"))
-      
-      #print(sapply(chunk_code, typeof))
-      chunk_code
-    })
-    
-    chunk_summ_code = paste0(summarize_code$assign_to, "=list(", summarize_code$expr, ")") %>% paste0(collapse = ", ")
-    
-    agg_code_df = summarize_code %>% 
-      select(expr_id, name, agg_expr, orig_code) %>% 
-      unique %>% 
-      transmute(agg_code = paste0(ifelse(name == "", paste0("`", orig_code, "` = "), paste0(name, "=")), agg_expr))
-    
-    agg_summ_code = paste0(agg_code_df$agg_code, collapse = ",")
-    
-    return(list(chunk_summ_code = chunk_summ_code, agg_summ_code = agg_summ_code))
-  }, error = function(e) {
-    return(summ_code_quosure)
-  })
+  class(.data) <- c("summarized_disk.frame", "disk.frame")
+  attr(.data, "summarize_code") = dotdotdot
   
+  return(.data)
 }
 
 
@@ -397,8 +291,3 @@ generate_summ_code <- function(...) {
 #' @importFrom dplyr summarize
 #' @rdname group_by
 summarise.disk.frame <- summarize.disk.frame
-
-
-
-
-
diff --git a/R/rbindlist.disk.frame.r b/R/rbindlist.disk.frame.r
index 7bbdd19f..87850ad1 100644
--- a/R/rbindlist.disk.frame.r
+++ b/R/rbindlist.disk.frame.r
@@ -5,7 +5,7 @@
 #' @param parallel if TRUE then bind multiple disk.frame simultaneously, Defaults to TRUE
 #' @param compress 0-100, 100 being the highest compression rate.
 #' @param overwrite overwrite the output directory
-#' @param .progress A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}
+#' @param .progress A logical, for whether or not to show progress.
 #' @import fs
 #' @importFrom data.table data.table setDT
 #' @importFrom future.apply future_lapply
diff --git a/R/rechunk.r b/R/rechunk.r
index 142b0576..7b0e6db6 100644
--- a/R/rechunk.r
+++ b/R/rechunk.r
@@ -22,9 +22,8 @@
 #' # clean up cars.df
 #' delete(cars.df)
 #' delete(cars2.df)
-rechunk <- function(df, nchunks, outdir = attr(df, "path", exact=TRUE), shardby = NULL, overwrite = TRUE, shardby_function="hash", sort_splits=NULL, desc_vars=NULL) {
-  
-  # we need to force the chunks to be computed first as it's common to make nchunks a multiple of chunks(df)
+rechunk <- function(df, nchunks = disk.frame::nchunks(df), outdir = attr(df, "path", exact=TRUE), shardby = NULL, overwrite = TRUE) {
+    # we need to force the chunks to be computed first as it's common to make nchunks a multiple of chunks(df)
   # but if we do it too late then the folder could be empty
   force(nchunks) 
   
@@ -52,9 +51,9 @@ rechunk <- function(df, nchunks, outdir = attr(df, "path", exact=TRUE), shardby
     short_files = dir(outdir)
     
     # move all files to the back up folder
-    purrr::map(full_files, ~{
-      fs::file_move(.x, back_up_tmp_dir)
-    })
+    for(file in full_files) {
+      fs::file_move(file, back_up_tmp_dir)
+    }
     
     if(fs::dir_exists(file.path(outdir, ".metadata"))) {
       fs::dir_delete(file.path(outdir, ".metadata"))
@@ -76,9 +75,14 @@ rechunk <- function(df, nchunks, outdir = attr(df, "path", exact=TRUE), shardby
     shardby = existing_shardkey[[1]]
   }
 
-
   if(user_had_set_shard_by) {
-    return(hard_group_by(df, shardby, nchunks = nchunks, outdir = outdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars))
+    tmp = cmap(df, ~{
+      shard(.x, shardby, nchunks=nchunks, overwrite=FALSE)
+    }) %>% collect_list
+    
+    return(
+      rbindlist.disk.frame(tmp)
+    )
   } else if (identical(shardby, "") | is.null(shardby)) {
     # if no existing shardby 
     nr = nrow(df)
@@ -138,9 +142,9 @@ rechunk <- function(df, nchunks, outdir = attr(df, "path", exact=TRUE), shardby
     tmp_fdlr = tempfile("rechunk_shard")
     fs::dir_create(tmp_fdlr)
 
-    oks = furrr::future_map(which(lp == 1), function(i) {
-      file_chunk = file.path(attr(df, "path", exact=TRUE), i %>% paste0(".fst"))
-      fs::file_move(file_chunk, file.path(tmp_fdlr, possibles_new_chunk_id[[i]] %>% paste0(".fst")))
+    oks = future.apply::future_lapply(which(lp == 1), function(i) {
+      file_chunk = file.path(attr(df, "path", exact=TRUE), paste0(i, ".fst"))
+      fs::file_move(file_chunk, file.path(tmp_fdlr, paste0(possibles_new_chunk_id[[i]], ".fst")))
       disk.frame(tmp_fdlr)
     })
     
diff --git a/R/recommend_nchunks.r b/R/recommend_nchunks.r
index e5be6ac0..2b987600 100644
--- a/R/recommend_nchunks.r
+++ b/R/recommend_nchunks.r
@@ -85,8 +85,6 @@ df_ram_size <- function() {
           message(system("wmic MemoryChip get Capacity", intern=TRUE))
           message("")
           message("")
-          #message("The option disk.frame.ram_size is not set. 
-          #message("To set the ram_size, do options(disk.frame_ram_size = your_ram_size_in_gigabytes)")
           ram_size = 16
         }
       } 
diff --git a/R/semi_join.r b/R/semi_join.r
index fb46350f..f462efac 100644
--- a/R/semi_join.r
+++ b/R/semi_join.r
@@ -17,11 +17,11 @@ semi_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
   overwrite_check(outdir, overwrite)
   
   if("data.frame" %in% class(y)) {
-    quo_dotdotdot = enquos(...)
-    cmap_dfr(x, ~{
-      code = quo(semi_join(.x, y, by = by, copy = copy, !!!quo_dotdotdot))
-      rlang::eval_tidy(code)
+    tmp = cmap_dfr(x, ~{
+      semi_join(.x, y, by = by, copy = copy, ...)
     }, .progress = .progress)
+    
+    return(tmp)
   } else if("disk.frame" %in% class(y)) {
     if(is.null(merge_by_chunk_id)) {
       stop("both x and y are disk.frames. You need to specify merge_by_chunk_id = TRUE or FALSE explicitly")
@@ -34,8 +34,8 @@ semi_join.disk.frame <- function(x, y, by=NULL, copy=FALSE, ..., outdir = tempfi
     ncy = nchunks(y)
     if (merge_by_chunk_id == FALSE) {
       warning("merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.")
-      x = hard_group_by(x, by, nchunks = max(ncy,ncx), overwrite = TRUE)
-      y = hard_group_by(y, by, nchunks = max(ncy,ncx), overwrite = TRUE)
+      x = rechunk(x, by, nchunks = max(ncy,ncx), outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
+      y = rechunk(y, by, nchunks = max(ncy,ncx), outdir=tempfile(fileext = ".jdf"), overwrite = FALSE)
       return(semi_join.disk.frame(x, y, by, copy = copy, outdir = outdir, merge_by_chunk_id = TRUE, overwrite = overwrite, .progress = .progress))
     } else if ((identical(shardkey(x)$shardkey, "") & identical(shardkey(y)$shardkey, "")) | identical(shardkey(x), shardkey(y))) {
       res = cmap2.disk.frame(x, y, ~{
diff --git a/R/shard.r b/R/shard.r
index 33f989fb..227897cc 100644
--- a/R/shard.r
+++ b/R/shard.r
@@ -18,32 +18,33 @@
 #'
 #' # clean up cars.df
 #' delete(iris.df)
-shard <- function(df, shardby, outdir = tempfile(fileext = ".df"), ..., nchunks = recommend_nchunks(df), overwrite = FALSE, shardby_function="hash", sort_splits=NULL, desc_vars=NULL) {
+shard <- function(df, shardby, outdir = tempfile(fileext = ".df"), ..., nchunks = recommend_nchunks(df), overwrite = FALSE) {
   force(nchunks)
   overwrite_check(outdir, overwrite)
-  stopifnot(shardby_function %in% c("hash", "sort"))
+  # stopifnot(shardby_function %in% c("hash", "sort"))
   
   if("data.frame" %in% class(df)) {
     data.table::setDT(df)
-    if(shardby_function == "hash"){
+    # if(shardby_function == "hash"){
       # message("Hashing...")
-      if(length(shardby) == 1) {
-        code = glue::glue("df[,.out.disk.frame.id := hashstr2i(as.character({shardby}), nchunks)]")
-      } else {
-        shardby_list = glue::glue("paste0({paste0(sort(shardby),collapse=',')})")
-        code = glue::glue("df[,.out.disk.frame.id := hashstr2i({shardby_list}, nchunks)]")
-      }
-    } else if(shardby_function == "sort"){
-      if(nchunks == 1){
-        message("Only one chunk: set .out.disk.frame.id = 0")
-        code = glue::glue("df[,.out.disk.frame.id := 0]")
-      } else {
-        shard_by_rule <- sortablestr2i(sort_splits, desc_vars)
-        # message(shard_by_rule)
-        setDT(df)
-        code = glue::glue("df[,.out.disk.frame.id := {shard_by_rule}]")
-      }
+    if(length(shardby) == 1) {
+      # TODO rewrite
+      code = glue::glue("df[,.out.disk.frame.id := hashstr2i(as.character({shardby}), nchunks)]")
+    } else {
+      shardby_list = glue::glue("paste0({paste0(sort(shardby),collapse=',')})")
+      code = glue::glue("df[,.out.disk.frame.id := hashstr2i({shardby_list}, nchunks)]")
     }
+    # } else if(shardby_function == "sort"){
+    #   if(nchunks == 1){
+    #     message("Only one chunk: set .out.disk.frame.id = 0")
+    #     code = glue::glue("df[,.out.disk.frame.id := 0]")
+    #   } else {
+    #     shard_by_rule <- sortablestr2i(sort_splits, desc_vars)
+    #     # message(shard_by_rule)
+    #     setDT(df)
+    #     code = glue::glue("df[,.out.disk.frame.id := {shard_by_rule}]")
+    #   }
+    # }
 
     tryCatch(
       eval(parse(text=code)),
@@ -54,11 +55,11 @@ shard <- function(df, shardby, outdir = tempfile(fileext = ".df"), ..., nchunks
     
     stopifnot(".out.disk.frame.id" %in% names(df))
     
-    res = write_disk.frame(df, outdir = outdir, nchunks = nchunks, overwrite = TRUE, shardby = shardby, shardchunks = nchunks, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars)  
+    res = write_disk.frame(df, outdir = outdir, nchunks = nchunks, overwrite = TRUE, shardby = shardby, shardchunks = nchunks)
     return(res)
   } else if ("disk.frame" %in% class(df)){
     nchunks_rechunk = nchunks
-    return(rechunk(df, shardby = shardby, nchunks = nchunks_rechunk, outdir = outdir, overwrite = TRUE, shardby_function=shardby_function, sort_splits=sort_splits, desc_vars=desc_vars))
+    return(rechunk(df, shardby = shardby, nchunks = nchunks_rechunk, outdir = outdir, overwrite = TRUE))
   }
 }
 
diff --git a/R/util.r b/R/util.r
index ef7a8d8f..8b760f0f 100644
--- a/R/util.r
+++ b/R/util.r
@@ -26,7 +26,7 @@ gen_datatable_synthetic <- function(N=2e8, K=100) {
   )
 }
 
-#' Used to convert a function to from purrr syntax if needed
+#' Used to convert a function to purrr syntax if needed
 #' @param .f a normal function or purrr syntax function i.e. `~{ ...code...}`
 #' @importFrom purrr as_mapper 
 purrr_as_mapper <- function(.f) {
diff --git a/R/write_disk.frame.r b/R/write_disk.frame.r
index 986d5de0..cdfd0c36 100644
--- a/R/write_disk.frame.r
+++ b/R/write_disk.frame.r
@@ -58,8 +58,8 @@ write_disk.frame <- function(
           fst::write_fst(chunk, out_chunk_name, compress)
           return(files_shortname)
         }
-        NULL # return NULL
-      }, ...)
+        return(NULL)
+      }, ..., future.seed = TRUE)
       return(disk.frame(outdir))
     } else {
       # TODO really inefficient
diff --git a/man/bind_rows.disk.frame.Rd b/man/bind_rows.disk.frame.Rd
new file mode 100644
index 00000000..0457d70f
--- /dev/null
+++ b/man/bind_rows.disk.frame.Rd
@@ -0,0 +1,14 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/bind_rows.r
+\name{bind_rows.disk.frame}
+\alias{bind_rows.disk.frame}
+\title{Bind rows}
+\usage{
+bind_rows.disk.frame(...)
+}
+\arguments{
+\item{...}{}
+}
+\description{
+Bind rows
+}
diff --git a/man/cmap.Rd b/man/cmap.Rd
index cb462a42..4189ce18 100644
--- a/man/cmap.Rd
+++ b/man/cmap.Rd
@@ -17,19 +17,7 @@
 \usage{
 cmap(.x, .f, ...)
 
-\method{cmap}{disk.frame}(
-  .x,
-  .f,
-  ...,
-  outdir = NULL,
-  keep = NULL,
-  chunks = nchunks(.x),
-  compress = 50,
-  lazy = TRUE,
-  overwrite = FALSE,
-  vars_and_pkgs = future::getGlobalsAndPackages(.f, envir = parent.frame()),
-  .progress = TRUE
-)
+\method{cmap}{disk.frame}(.x, .f, ...)
 
 cmap_dfr(.x, .f, ..., .id = NULL)
 
@@ -76,15 +64,15 @@ clapply(...)
 
 \item{...}{Passed to `collect` and `write_disk.frame`}
 
-\item{outdir}{the output directory}
-
-\item{lazy}{if TRUE then do this lazily}
-
 \item{use.names}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{fill}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{idcol}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
+
+\item{outdir}{the output directory}
+
+\item{lazy}{if TRUE then do this lazily}
 }
 \description{
 Apply the same function to all chunks
diff --git a/man/collect.Rd b/man/collect.Rd
index 0e74f39f..0acee69c 100644
--- a/man/collect.Rd
+++ b/man/collect.Rd
@@ -6,7 +6,7 @@
 \alias{collect.summarized_disk.frame}
 \title{Bring the disk.frame into R}
 \usage{
-\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "lazyfn")))
+\method{collect}{disk.frame}(x, ..., parallel = !is.null(attr(x, "recordings")))
 
 collect_list(
   x,
diff --git a/man/csv_to_disk.frame.Rd b/man/csv_to_disk.frame.Rd
index 8c59d1de..b82ac585 100644
--- a/man/csv_to_disk.frame.Rd
+++ b/man/csv_to_disk.frame.Rd
@@ -47,8 +47,7 @@ the highest compression ratio.}
 
 \item{header}{Whether the files have header. Defaults to TRUE}
 
-\item{.progress}{A logical, for whether or not to print a progress bar for
-multiprocess, multisession, and multicore plans. From {furrr}}
+\item{.progress}{A logical, for whether or not to show progress}
 
 \item{backend}{The CSV reader backend to choose: "data.table" or "readr". 
 disk.frame does not have its own CSV reader. It uses either
diff --git a/man/group_by.Rd b/man/group_by.Rd
index d65a3437..56bd42f7 100644
--- a/man/group_by.Rd
+++ b/man/group_by.Rd
@@ -12,7 +12,12 @@
 
 \method{summarize}{grouped_disk.frame}(.data, ...)
 
-\method{group_by}{disk.frame}(.data, ..., .add = FALSE, .drop = stop(".drop not yet supported"))
+\method{group_by}{disk.frame}(
+  .data,
+  ...,
+  .add = FALSE,
+  .drop = stop("disk.frame does not support `.drop` in `group_by` at this stage")
+)
 
 \method{summarize}{disk.frame}(.data, ...)
 
diff --git a/man/hard_arrange.Rd b/man/hard_arrange.Rd
deleted file mode 100644
index a866f91d..00000000
--- a/man/hard_arrange.Rd
+++ /dev/null
@@ -1,53 +0,0 @@
-% Generated by roxygen2: do not edit by hand
-% Please edit documentation in R/hard_arrange.r
-\name{hard_arrange}
-\alias{hard_arrange}
-\alias{hard_arrange.data.frame}
-\alias{hard_arrange.disk.frame}
-\title{Perform a hard arrange}
-\usage{
-hard_arrange(df, ..., add = FALSE, .drop = FALSE)
-
-\method{hard_arrange}{data.frame}(df, ...)
-
-\method{hard_arrange}{disk.frame}(
-  df,
-  ...,
-  outdir = tempfile("tmp_disk_frame_hard_arrange"),
-  nchunks = disk.frame::nchunks(df),
-  overwrite = TRUE
-)
-}
-\arguments{
-\item{df}{a disk.frame}
-
-\item{...}{grouping variables}
-
-\item{add}{same as dplyr::arrange}
-
-\item{.drop}{same as dplyr::arrange}
-
-\item{outdir}{the output directory}
-
-\item{nchunks}{The number of chunks in the output. Defaults = nchunks.disk.frame(df)}
-
-\item{overwrite}{overwrite the out put directory}
-}
-\description{
-A hard_arrange is a sort by that also reorganizes the chunks to ensure that
-every unique grouping of `by`` is in the same chunk. Or in other words, every
-row that share the same `by` value will end up in the same chunk.
-}
-\examples{
-iris.df = as.disk.frame(iris, nchunks = 2)
-
-# arrange iris.df by specifies and ensure rows with the same specifies are in the same chunk
-iris_hard.df = hard_arrange(iris.df, Species)
-
-get_chunk(iris_hard.df, 1)
-get_chunk(iris_hard.df, 2)
-
-# clean up cars.df
-delete(iris.df)
-delete(iris_hard.df)
-}
diff --git a/man/hard_group_by.Rd b/man/hard_group_by.Rd
deleted file mode 100644
index 3d2af379..00000000
--- a/man/hard_group_by.Rd
+++ /dev/null
@@ -1,65 +0,0 @@
-% Generated by roxygen2: do not edit by hand
-% Please edit documentation in R/hard_group_by.r
-\name{hard_group_by}
-\alias{hard_group_by}
-\alias{hard_group_by.data.frame}
-\alias{hard_group_by.disk.frame}
-\title{Perform a hard group}
-\usage{
-hard_group_by(df, ..., .add = FALSE, .drop = FALSE)
-
-\method{hard_group_by}{data.frame}(df, ..., .add = FALSE, .drop = FALSE)
-
-\method{hard_group_by}{disk.frame}(
-  df,
-  ...,
-  outdir = tempfile("tmp_disk_frame_hard_group_by"),
-  nchunks = disk.frame::nchunks(df),
-  overwrite = TRUE,
-  shardby_function = "hash",
-  sort_splits = NULL,
-  desc_vars = NULL,
-  sort_split_sample_size = 100
-)
-}
-\arguments{
-\item{df}{a disk.frame}
-
-\item{...}{grouping variables}
-
-\item{.add}{same as dplyr::group_by}
-
-\item{.drop}{same as dplyr::group_by}
-
-\item{outdir}{the output directory}
-
-\item{nchunks}{The number of chunks in the output. Defaults = nchunks.disk.frame(df)}
-
-\item{overwrite}{overwrite the out put directory}
-
-\item{shardby_function}{splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks}
-
-\item{sort_splits}{for the "sort" shardby function, a dataframe with the split values.}
-
-\item{desc_vars}{for the "sort" shardby function, the variables to sort descending.}
-
-\item{sort_split_sample_size}{for the "sort" shardby function, if sort_splits is null, the number of rows to sample per chunk for random splits.}
-}
-\description{
-A hard_group_by is a group by that also reorganizes the chunks to ensure that
-every unique grouping of `by`` is in the same chunk. Or in other words, every
-row that share the same `by` value will end up in the same chunk.
-}
-\examples{
-iris.df = as.disk.frame(iris, nchunks = 2)
-
-# group_by iris.df by specifies and ensure rows with the same specifies are in the same chunk
-iris_hard.df = hard_group_by(iris.df, Species)
-
-get_chunk(iris_hard.df, 1)
-get_chunk(iris_hard.df, 2)
-
-# clean up cars.df
-delete(iris.df)
-delete(iris_hard.df)
-}
diff --git a/man/join.Rd b/man/join.Rd
index 74d6d0dd..1ea3d3e1 100644
--- a/man/join.Rd
+++ b/man/join.Rd
@@ -38,7 +38,9 @@
   y,
   by = NULL,
   copy = FALSE,
+  suffix = c(".x", ".y"),
   ...,
+  keep = FALSE,
   outdir = tempfile("tmp_disk_frame_inner_join"),
   merge_by_chunk_id = NULL,
   overwrite = TRUE,
@@ -50,7 +52,9 @@
   y,
   by = NULL,
   copy = FALSE,
+  suffix = c(".x", ".y"),
   ...,
+  keep = FALSE,
   outdir = tempfile("tmp_disk_frame_left_join"),
   merge_by_chunk_id = FALSE,
   overwrite = TRUE,
diff --git a/man/purrr_as_mapper.Rd b/man/purrr_as_mapper.Rd
index b7071d7b..a34dd80b 100644
--- a/man/purrr_as_mapper.Rd
+++ b/man/purrr_as_mapper.Rd
@@ -2,7 +2,7 @@
 % Please edit documentation in R/util.r
 \name{purrr_as_mapper}
 \alias{purrr_as_mapper}
-\title{Used to convert a function to from purrr syntax if needed}
+\title{Used to convert a function to purrr syntax if needed}
 \usage{
 purrr_as_mapper(.f)
 }
@@ -10,5 +10,5 @@ purrr_as_mapper(.f)
 \item{.f}{a normal function or purrr syntax function i.e. `~{ ...code...}`}
 }
 \description{
-Used to convert a function to from purrr syntax if needed
+Used to convert a function to purrr syntax if needed
 }
diff --git a/man/rbindlist.disk.frame.Rd b/man/rbindlist.disk.frame.Rd
index 9a334037..0549ebd5 100644
--- a/man/rbindlist.disk.frame.Rd
+++ b/man/rbindlist.disk.frame.Rd
@@ -27,7 +27,7 @@ rbindlist.disk.frame(
 
 \item{overwrite}{overwrite the output directory}
 
-\item{.progress}{A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From {furrr}}
+\item{.progress}{A logical, for whether or not to show progress.}
 }
 \description{
 rbindlist disk.frames together
diff --git a/man/rechunk.Rd b/man/rechunk.Rd
index ce74ac58..fa42e2eb 100644
--- a/man/rechunk.Rd
+++ b/man/rechunk.Rd
@@ -6,13 +6,10 @@
 \usage{
 rechunk(
   df,
-  nchunks,
+  nchunks = disk.frame::nchunks(df),
   outdir = attr(df, "path", exact = TRUE),
   shardby = NULL,
-  overwrite = TRUE,
-  shardby_function = "hash",
-  sort_splits = NULL,
-  desc_vars = NULL
+  overwrite = TRUE
 )
 }
 \arguments{
diff --git a/man/shard.Rd b/man/shard.Rd
index 09b8ef5c..1a9ff5e7 100644
--- a/man/shard.Rd
+++ b/man/shard.Rd
@@ -11,10 +11,7 @@ shard(
   outdir = tempfile(fileext = ".df"),
   ...,
   nchunks = recommend_nchunks(df),
-  overwrite = FALSE,
-  shardby_function = "hash",
-  sort_splits = NULL,
-  desc_vars = NULL
+  overwrite = FALSE
 )
 
 distribute(...)
diff --git a/misc/NAMESPACE_20190205 b/misc/NAMESPACE_20190205
deleted file mode 100644
index 72ead0da..00000000
--- a/misc/NAMESPACE_20190205
+++ /dev/null
@@ -1,99 +0,0 @@
-# Generated by roxygen2: do not edit by hand
-
-S3method("[",disk.frame)
-S3method(anti_join,disk.frame)
-S3method(arrange_,disk.frame)
-S3method(as.data.frame,disk.frame)
-S3method(as.data.table,disk.frame)
-S3method(collect,disk.frame)
-S3method(compute,disk.frame)
-S3method(delayed,disk.frame)
-S3method(do_,disk.frame)
-S3method(filter_,disk.frame)
-S3method(full_join,disk.frame)
-S3method(get_chunk,disk.frame)
-S3method(glimpse,disk.frame)
-S3method(group_by,disk.frame)
-S3method(group_by_,disk.frame)
-S3method(groups,disk.frame)
-S3method(hard_group_by,disk.frame)
-S3method(head,disk.frame)
-S3method(inner_join,disk.frame)
-S3method(left_join,disk.frame)
-S3method(merge,disk.frame)
-S3method(mutate_,disk.frame)
-S3method(names,disk.frame)
-S3method(nchunk,disk.frame)
-S3method(nchunks,disk.frame)
-S3method(ncol,default)
-S3method(ncol,disk.frame)
-S3method(nrow,default)
-S3method(nrow,disk.frame)
-S3method(print,disk.frame)
-S3method(print,xgdf_scorecard)
-S3method(rename_,disk.frame)
-S3method(sample_frac,disk.frame)
-S3method(select_,disk.frame)
-S3method(semi_join,disk.frame)
-S3method(summarise_,disk.frame)
-S3method(tail,disk.frame)
-S3method(tbl_vars,disk.frame)
-S3method(transmute_,disk.frame)
-export(add_chunk)
-export(add_meta)
-export(as.disk.frame)
-export(auc)
-export(chunk_lapply)
-export(collect_list)
-export(colnames)
-export(csv_to_disk.frame)
-export(delayed)
-export(disk.frame)
-export(distribute)
-export(evalparseglue)
-export(foverlaps.disk.frame)
-export(get_chunk)
-export(hard_group_by)
-export(is_disk.frame)
-export(lazy)
-export(map.disk.frame)
-export(map_by_chunk_id)
-export(nchunk)
-export(nchunks)
-export(ncol)
-export(nrow)
-export(overwrite_check)
-export(rbindlist.disk.frame)
-export(rechunk)
-export(recommend_nchunks)
-export(remove_chunk)
-export(shard)
-export(shardkey)
-export(srckeep)
-export(write_disk.frame)
-export(zip_to_disk.frame)
-import(base)
-import(dplyr)
-import(dtplyr)
-import(fs)
-import(fst)
-import(furrr)
-import(purrr)
-import(stringr)
-importFrom(Rcpp,evalCpp)
-importFrom(data.table,as.data.table)
-importFrom(data.table,data.table)
-importFrom(data.table,foverlaps)
-importFrom(data.table,rbindlist)
-importFrom(data.table,setDT)
-importFrom(furrr,future_map_dfr)
-importFrom(future.apply,future_lapply)
-importFrom(glue,glue)
-importFrom(jsonlite,fromJSON)
-importFrom(jsonlite,toJSON)
-importFrom(pryr,object_size)
-importFrom(purrr,map_dfr)
-importFrom(xgboost,xgb.DMatrix)
-importFrom(xgboost,xgb.save)
-importFrom(xgboost,xgboost)
-useDynLib(disk.frame)
diff --git a/misc/NAMESPACE_ok b/misc/NAMESPACE_ok
deleted file mode 100644
index 18b7d99c..00000000
--- a/misc/NAMESPACE_ok
+++ /dev/null
@@ -1,61 +0,0 @@
-# Generated by roxygen2: do not edit by hand
-useDynLib(disk.frame, .registration=TRUE)
-importFrom(Rcpp,evalCpp)
-S3method("[",disk.frame)
-S3method(anti_join,disk.frame)
-S3method(as.data.frame,disk.frame)
-S3method(as.data.table,disk.frame)
-S3method(collect,disk.frame)
-S3method(do_,disk.frame)
-S3method(filter_,disk.frame)
-S3method(get_chunk,disk.frame)
-S3method(group_by_,disk.frame)
-S3method(groups,disk.frame)
-S3method(hard_group_by,disk.frame)
-S3method(head,disk.frame)
-S3method(inner_join,disk.frame)
-S3method(keep,disk.frame)
-S3method(left_join,disk.frame)
-S3method(map,disk.frame)
-S3method(merge,disk.frame)
-S3method(mutate_,disk.frame)
-S3method(names,disk.frame)
-S3method(nchunk,disk.frame)
-S3method(nchunks,disk.frame)
-S3method(nrow,default)
-S3method(nrow,disk.frame)
-S3method(print,disk.frame)
-S3method(rename_,disk.frame)
-S3method(select_,disk.frame)
-S3method(semi_join,disk.frame)
-S3method(summarise_,disk.frame)
-S3method(tail,disk.frame)
-S3method(tbl_vars,disk.frame)
-S3method(transmute_,disk.frame)
-export(chunk_lapply)
-export(collect)
-export(colnames.disk.frame)
-export(delayed)
-export(disk.frame)
-export(distribute)
-export(foverlaps.disk.frame)
-export(get_chunk)
-export(hard_group_by)
-export(keep)
-export(lazy)
-export(map)
-export(nchunk)
-export(nchunks)
-export(nrow)
-export(progressbar)
-export(rbindlist.disk.frame)
-export(shard)
-import(data.table)
-import(dplyr)
-import(dtplyr)
-import(fs)
-import(fst)
-import(future)
-import(future.apply)
-import(glue)
-import(purrr)
diff --git a/tests/testthat/test-anti_join.R b/tests/testthat/test-anti_join.R
index 348ebaf2..208242ac 100644
--- a/tests/testthat/test-anti_join.R
+++ b/tests/testthat/test-anti_join.R
@@ -24,8 +24,10 @@ test_that("testing anti_join where right is data.frame", {
   bc = collect(b)
   dc = collect(d)
   
-  abc = anti_join(a, bc, by = "a") %>% collect
-  expect_equal(nrow(abc), 50)
+  abc_pre = anti_join(a, bc, by = "a")
+  abc = collect(abc_pre)
+  abc_true = anti_join(collect(a), bc, by = "a")
+  expect_equal(nrow(abc), nrow(abc_true))
   
   abc0 = anti_join(a, bc, by = c("a","b")) %>% collect
   expect_equal(nrow(abc0), 100)
diff --git a/tests/testthat/test-cmap2.r b/tests/testthat/test-cmap2.r
index 926d49ee..aa1a8569 100644
--- a/tests/testthat/test-cmap2.r
+++ b/tests/testthat/test-cmap2.r
@@ -28,7 +28,7 @@ test_that("testing map2 .y is not disk.frame", {
   d = 1:nchunks(b)
   
   # return 1 row from each chunk
-  expect_warning(df <- cmap2(b, d, ~.x[1,.(y = .y)], outdir = "tmp_map2_out2.df"))
+  expect_warning(df <- cmap2(b, d, ~.x[1, ] %>% mutate(y = .y), outdir = "tmp_map2_out2.df"))
   
   expect_type(df, "list")
   
diff --git a/tests/testthat/test-csv2disk.frame.r b/tests/testthat/test-csv2disk.frame.r
index 3d78482b..8a5599d2 100644
--- a/tests/testthat/test-csv2disk.frame.r
+++ b/tests/testthat/test-csv2disk.frame.r
@@ -16,14 +16,14 @@ test_that("csv2disk.frame works with no shard", {
   
   dff1 = dff %>% 
     group_by(id1) %>% 
-    summarize(sum(V1)) %>% 
+    summarize(v1=sum(v1)) %>% 
     collect
   
   dff2 = dff1 %>% 
     group_by(id1) %>% 
-    summarize(sum(V1))
+    summarize(sum(v1))
   
-  expect_false(nrow(dff1) == nrow(dff2))
+  expect_true(nrow(dff1) == nrow(dff2))
   expect_equal(nrow(dff), 1e3+11)
   expect_equal(ncol(dff), 10)
 })
@@ -78,7 +78,7 @@ test_that("csv2disk.frame tests readr", {
   #   csv_path,
   #   outdir = df_path,
   #   shardby = "minute",
-  #   overwrite = T,
+    # overwrite = T,
   #   backend = "readr")
 })
 
diff --git a/tests/testthat/test-data-table.r b/tests/testthat/test-data-table.r
index 0275ee4a..d1629450 100644
--- a/tests/testthat/test-data-table.r
+++ b/tests/testthat/test-data-table.r
@@ -15,17 +15,10 @@ test_that("data.table .N", {
 
 test_that("data.table .N+y V1", {
   df = disk.frame(file.path(tempdir(), "tmp_col_delete"))
-  if(interactive()) {
-    y = 2
-    
-    {y = 3; a <- df[,.(n_plus_y = .N + y), v1]}
-    b <- df[,.N, v1]
-    
-    expect_equal(a$n_plus_y, b$N + y)
-  } else {
-    # TODO figure out why the above fails
-    expect_equal(2L, 2L)
-  }
+  y = 2
+  {y = 3; a <- df[,.(n_plus_y = .N + y), v1]}
+  b <- df[,.N, v1]
+  expect_equal(a$n_plus_y, b$N + y)
 })
 
 test_that("data.table do not return a data.table", {
@@ -36,6 +29,28 @@ test_that("data.table do not return a data.table", {
   expect_equal(length(res), 8)
 })
 
+test_that("data.table global vars",  {
+  # Load packages
+  library(data.table)
+
+  # Create data table and diskframe object of storm data
+  storms_df <- as.disk.frame(storms)
+  storms_dt <- as.data.table(storms)
+  
+  # Create search function
+  grep_storm_name <- function(dfr, storm_name){
+    
+    dfr[name %like% storm_name]
+    
+  }
+  
+  # Check function with data.table object
+  grep_storm_name(storms_dt, "^A")
+  
+  # Check function with diskframe object
+  grep_storm_name(storms_df, "^A")
+})
+
 teardown({
   fs::dir_delete(file.path(tempdir(), "tmp_col_delete"))
 })
diff --git a/tests/testthat/test-dplyr-verbs.r b/tests/testthat/test-dplyr-verbs.r
index f8f18f35..01314556 100644
--- a/tests/testthat/test-dplyr-verbs.r
+++ b/tests/testthat/test-dplyr-verbs.r
@@ -162,9 +162,9 @@ test_that("filter failure: prevent github #191 regression",  {
   flights_df = as.disk.frame(nycflights13::flights)
   
   # expect error due to syntax error
-  expect_warning(expect_error(flights_df %>% 
+  expect_error(flights_df %>% 
     filter(tailnum %in% paste0(unique(nycflights13::flights$tailnum)[1:60]), "") %>% 
-    collect))
+    collect)
   
   delete(flights_df)
 })
diff --git a/tests/testthat/test-group-by.R b/tests/testthat/test-group-by.R
index d6684114..e61f75d3 100644
--- a/tests/testthat/test-group-by.R
+++ b/tests/testthat/test-group-by.R
@@ -1,55 +1,73 @@
 context("test-group_by")
 
 setup({
+  setup_disk.frame(2)
   df = disk.frame:::gen_datatable_synthetic(1e3+11)
   data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_gb.csv"))
 })
 
 
 test_that("new group_by framework", {
-  if(interactive()) {
-    iris.df = iris %>% 
-      as.disk.frame
-    
-    grpby = iris.df %>% 
-        group_by(Species) %>% 
-        summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
-        collect
-    
-    grpby2 = iris %>% 
-      group_by(Species) %>% 
-      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
-      arrange()
-    
-    for (n in names(grpby)) {
-      expect_true(all(grpby2[, n] == grpby[, n]) || all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
-    }
-    
-    delete(iris.df)
+  iris.df = iris %>%
+    as.disk.frame
+  
+  grpby = iris.df %>%
+    group_by(Species) %>%
+    summarize(
+      mean(Petal.Length),
+      sumx = sum(Petal.Length / Sepal.Width),
+      sd(Sepal.Width / Petal.Length),
+      var(Sepal.Width / Sepal.Width)
+    ) %>%
+    collect
+  
+  grpby2 = iris %>%
+    group_by(Species) %>%
+    summarize(
+      mean(Petal.Length),
+      sumx = sum(Petal.Length / Sepal.Width),
+      sd(Sepal.Width / Petal.Length),
+      var(Sepal.Width / Sepal.Width)
+    ) %>%
+    arrange()
+  
+  for (n in names(grpby)) {
+    expect_true(all(grpby2[, n] == grpby[, n]) ||
+                  all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
   }
-  expect_true(TRUE)
+  
+  delete(iris.df)
 })
 
+
 test_that("new group_by framework - no group-by just summarise", {
-  if(interactive()) {
-    iris.df = iris %>% 
-      as.disk.frame
-    
-    grpby = iris.df %>% 
-      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
-      collect
-    
-    grpby2 = iris %>% 
-      summarize(mean(Petal.Length), sumx = sum(Petal.Length/Sepal.Width), sd(Sepal.Width/ Petal.Length), var(Sepal.Width/ Sepal.Width)) %>% 
-      arrange()
-    
-    for (n in names(grpby)) {
-      expect_true(all(grpby2[, n] == grpby[, n]) || all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
-    }
-    
-    delete(iris.df)
+  iris.df = iris %>%
+    as.disk.frame
+  
+  grpby = iris.df %>%
+    summarize(
+      mean(Petal.Length),
+      sumx = sum(Petal.Length / Sepal.Width),
+      sd(Sepal.Width / Petal.Length),
+      var(Sepal.Width / Sepal.Width)
+    ) %>%
+    collect
+  
+  grpby2 = iris %>%
+    summarize(
+      mean(Petal.Length),
+      sumx = sum(Petal.Length / Sepal.Width),
+      sd(Sepal.Width / Petal.Length),
+      var(Sepal.Width / Sepal.Width)
+    ) %>%
+    arrange()
+  
+  for (n in names(grpby)) {
+    expect_true(all(grpby2[, n] == grpby[, n]) ||
+                  all(abs(grpby2[, n] - grpby[, n]) < 0.0001))
   }
-  expect_true(TRUE)
+  
+  delete(iris.df)
 })
 
 # test_that("new group_by framework - nested-group-by", {
@@ -90,108 +108,57 @@ test_that("new group_by framework - no group-by just summarise", {
 # })
 
 test_that("guard against github #241", {
-  if(interactive()) {
-    # I suspect there was an issue with number of chunk = 1
-    result_from_disk.frame = iris %>%
-      as.disk.frame(nchunks = 1) %>%
-      group_by(Species) %>%
-      summarize(
-        mean(Petal.Length),
-        sumx = sum(Petal.Length/Sepal.Width),
-        sd(Sepal.Width/ Petal.Length),
-        var(Sepal.Width/ Sepal.Width),
-        l = length(Sepal.Width/ Sepal.Width + 2),
-        max(Sepal.Width),
-        min(Sepal.Width),
-        median(Sepal.Width)
-      ) %>%
-      collect
-  } else {
-    expect_true(TRUE)
-  }
-})
-
-
-test_that("group_by", {
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  
-  dff_res = dff %>% 
-    collect %>% 
-    group_by(id1) %>% 
-    summarise(mv1 = mean(v1))
-  
-  dff1 <- dff %>% 
-    chunk_group_by(id1, id2) %>%
-    chunk_summarise(mv1 = mean(v1)) %>% 
+  # I suspect there was an issue with number of chunk = 1
+  result_from_disk.frame = iris %>%
+    as.disk.frame(nchunks = 1) %>%
+    group_by(Species) %>%
+    summarize(
+      mean(Petal.Length),
+      sumx = sum(Petal.Length / Sepal.Width),
+      sd(Sepal.Width / Petal.Length),
+      var(Sepal.Width / Sepal.Width),
+      l = length(Sepal.Width / Sepal.Width + 2),
+      max(Sepal.Width),
+      min(Sepal.Width),
+      median(Sepal.Width)
+    ) %>%
     collect
-
-  expect_false(nrow(dff1) == nrow(dff_res))
-})
-
-test_that("test hard_group_by on disk.frame", {
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  
-  dff_res = dff %>% 
-    collect %>% 
-    group_by(id1, id2) %>% 
-    summarise(mv1 = mean(v1))
-  
-  dff1 <- dff %>% 
-      hard_group_by(id1, id2) %>%
-      chunk_summarise(mv1 = mean(v1)) %>% collect
   
-  expect_equal(nrow(dff1), nrow(dff_res))
-})
-
-test_that("test hard_group_by on data.frame", {
-  df = disk.frame:::gen_datatable_synthetic(1e3+11)
-  
-  df1 = df %>% 
-    group_by(id1, id2) %>% 
-    summarise(mv1 = mean(v1))
-  
-  dff1 <- df %>% 
-    hard_group_by(id1,id2) %>%
-    summarise(mv1 = mean(v1))
-  
-  expect_equal(nrow(dff1), nrow(df1))
+  testthat::expect_true(TRUE)
 })
 
 
-test_that("test hard_group_by on disk.frame (sort)", {
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  
-  dff_res = dff %>% 
-    collect %>% 
-    group_by(id1, id2) %>% 
-    summarise(mv1 = mean(v1))
-  
-  dff1 <- dff %>% 
-    hard_group_by(id1, id2, shardby_function="sort") %>%
-    chunk_summarise(mv1 = mean(v1)) %>% collect
-  
-  expect_equal(nrow(dff1), nrow(dff_res))
-})
-
-test_that("test hard_group_by on data.frame (sort)", {
-  df = disk.frame:::gen_datatable_synthetic(1e3+11)
-  
-  df1 = df %>% 
-    group_by(id1, id2) %>% 
-    summarise(mv1 = mean(v1))
-  
-  dff1 <- df %>% 
-    hard_group_by(id1, id2, shardby_function="sort") %>%
-    summarise(mv1 = mean(v1))
-  
-  expect_equal(nrow(dff1), nrow(df1))
-})
+# TODO turn these on
+# test_that("test hard_group_by on disk.frame (sort)", {
+#   dff = csv_to_disk.frame(
+#     file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+#     file.path(tempdir(), "tmp_pls_delete_gb.df"))
+#   
+#   dff_res = dff %>% 
+#     collect %>% 
+#     group_by(id1, id2) %>% 
+#     summarise(mv1 = mean(v1))
+#   
+#   dff1 <- dff %>% 
+#     hard_group_by(id1, id2, shardby_function="sort") %>%
+#     chunk_summarise(mv1 = mean(v1)) %>% collect
+#   
+#   expect_equal(nrow(dff1), nrow(dff_res))
+# })
+# 
+# test_that("test hard_group_by on data.frame (sort)", {
+#   df = disk.frame:::gen_datatable_synthetic(1e3+11)
+#   
+#   df1 = df %>% 
+#     group_by(id1, id2) %>% 
+#     summarise(mv1 = mean(v1))
+#   
+#   dff1 <- df %>% 
+#     hard_group_by(id1, id2, shardby_function="sort") %>%
+#     summarise(mv1 = mean(v1))
+#   
+#   expect_equal(nrow(dff1), nrow(df1))
+# })
 
 test_that("guard against github 256", {
   test2 <- tibble::tibble(
@@ -204,6 +171,7 @@ test_that("guard against github 256", {
   correct_result = test2 %>%
     group_by(date, uid, proto, port) %>%
     summarize(n=n()) %>% 
+    ungroup %>% 
     collect
   
   test_df = as.disk.frame(test2, nchunks = 2, overwrite=TRUE)
@@ -226,7 +194,6 @@ test_that("guard against github 256 #2", {
   
   test_df = as.disk.frame(test2, nchunks = 2, overwrite=TRUE)
   
-  
   correct_result = test_df %>%
     group_by(!!!syms(names(test_df))) %>%
     summarize(n=n()) %>% 
@@ -241,10 +208,6 @@ test_that("guard against github 256 #2", {
 })
 
 test_that("guard against github 256 #3", {
-  library(testthat)
-  library(disk.frame)
-  setup_disk.frame()
-  
   test2 <- tibble::tibble(
     date = sample(1:10, 20, replace = TRUE),
     uid = sample(1:10, 20, replace = TRUE)
@@ -303,7 +266,40 @@ test_that("tests for github #250 2", {
   expect_equal(result1, result2)
 })
 
+
+test_that("tests for across", {
+  # TODO use a prototype approach?
+  result2 <- iris %>% 
+    group_by(across(where(is.numeric))) %>% 
+    summarize(Species)
+  
+  testthat::expect_error({result1 = iris %>% 
+    as.disk.frame() %>% 
+    group_by(across(where(is.numeric))) %>% 
+    summarize(Species) %>% 
+    collect}
+  )
+  
+  #expect_equal(result1, result2)
+})
+
+test_that("tests for {{}}", {
+  # TODO make this work
+  bracket_groupby <- function(input_data, grp_cols) {
+    input_data %>% 
+      group_by({{grp_cols}}) %>% 
+      summarize(mean(Petal.Length)) %>% 
+      collect
+  }
+  
+  a = bracket_groupby(iris, Species)
+  
+  b = bracket_groupby(as.disk.frame(iris), Species)
+  
+  expect_equal(a, b)
+})
+
 teardown({
-  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
-  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
+  # fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+  # fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
 })
diff --git a/tests/testthat/test-hard-arrange.R b/tests/testthat/test-hard-arrange.R
index 0419cee8..01208fe8 100644
--- a/tests/testthat/test-hard-arrange.R
+++ b/tests/testthat/test-hard-arrange.R
@@ -1,111 +1,111 @@
-context("test-arrange")
-
-setup({
-  
-  df = disk.frame:::gen_datatable_synthetic(1e3+11)
-  data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_gb.csv"))
-})
-
-test_that("test hard_arrange on disk.frame, single chunk", {
-  # Randomise rows since rows are already sorted
-  iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 1)
-  iris_hard.df = hard_arrange(iris.df, Species)
-  
-  # Check sort
-  expect_true(!is.unsorted(iris_hard.df$Species))
-})
-
-test_that("test hard_arrange on disk.frame, single variable", {
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  
-  # Sort ascending, one level
-  sorted_dff <- dff %>% hard_arrange(id1)
-  sorted_df <- sorted_dff %>% collect
-  
-  expect_true(!is.unsorted(sorted_df$id1))
-})
-
-test_that("test hard_arrange on disk.frame, factor data type", {
-  iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 2)
-  iris_hard.df = hard_arrange(iris.df, Species)
-
-  expect_true(!is.unsorted(iris_hard.df$Species))  
-})
-
-test_that("test hard_arrange on disk.frame, date data type", {
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  sorted_dff <- dff %>% hard_arrange(date1)
-  
-  expect_true(!is.unsorted(sorted_dff$date1))    
-})
-
-test_that("test hard_arrange on disk.frame, two and three variables", {   
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-  
-  dfp <- read.csv(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
-  
-  # Sort ascending, two levels
-  sorted_dff <- dff %>% hard_arrange(id1, id4) %>% collect
-  sorted_dfp <- dff %>% collect %>% dplyr::arrange(id1, id4) 
-  
-  # Compare vs dplyr
-  expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
-  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
-  
-  # Sort ascending, three levels, from already partially sorted disk frame
-  sorted_dff2 <- sorted_dff %>% hard_arrange(id1, id4, id6) %>% collect
-  sorted_dfp2 <- dff %>% collect %>% dplyr::arrange(id1, id4, id6) 
-  
-  # Compare vs dplyr
-  expect_true(all(sorted_dff2$id1 == sorted_dfp2$id1))
-  expect_true(all(sorted_dff2$id4 == sorted_dfp2$id4))
-  expect_true(all(sorted_dff2$id6 == sorted_dfp2$id6))  
-})
-
-test_that("test hard_arrange on disk.frame, two factors", { 
-  dff = csv_to_disk.frame(
-    file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
-    file.path(tempdir(), "tmp_pls_delete_gb.df"))
-    
-  # Sort decending, two levels
-  desc_dff <- dff %>% hard_arrange(desc(id4), id2)
-  desc_dff <- desc_dff %>% collect
-  
-  #  Level 1
-  expect_true(!is.unsorted(-desc_dff$id4))
-  
-  #  Level 2
-  desc_dff$id4_id2 <- paste0(
-    formatC(max(desc_dff$id4) - desc_dff$id4, width=3, format="d", flag= "0"), 
-    desc_dff$id2)
-  expect_true(!is.unsorted(-desc_dff$id4))
-})
-
-test_that("test hard_arrange on data.frame vs dplyr", {
-  df = disk.frame:::gen_datatable_synthetic(1e3+11)
-  
-  # Sort ascending
-  sorted_dff <- df %>% hard_arrange(id1, id4) %>% collect
-  sorted_dfp <- df %>% dplyr::arrange(id1, id4)
-  
-  expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
-  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
-  
-  # Sort decending
-  desc_dff <- df %>% hard_arrange(desc(id4), id2) %>% collect
-  desc_dfp <- df %>% dplyr::arrange(desc(id4), id2) 
-  
-  expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
-  expect_true(all(sorted_dff$id2 == sorted_dfp$dfp))  
-})
-
-teardown({
-  fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
-  fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
-})
\ No newline at end of file
+# context("test-arrange")
+# 
+# setup({
+#   
+#   df = disk.frame:::gen_datatable_synthetic(1e3+11)
+#   data.table::fwrite(df, file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+# })
+# 
+# test_that("test hard_arrange on disk.frame, single chunk", {
+#   # Randomise rows since rows are already sorted
+#   iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 1)
+#   iris_hard.df = hard_arrange(iris.df, Species)
+#   
+#   # Check sort
+#   expect_true(!is.unsorted(iris_hard.df$Species))
+# })
+# 
+# test_that("test hard_arrange on disk.frame, single variable", {
+#   dff = csv_to_disk.frame(
+#     file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+#     file.path(tempdir(), "tmp_pls_delete_gb.df"))
+#   
+#   # Sort ascending, one level
+#   sorted_dff <- dff %>% hard_arrange(id1)
+#   sorted_df <- sorted_dff %>% collect
+#   
+#   expect_true(!is.unsorted(sorted_df$id1))
+# })
+# 
+# test_that("test hard_arrange on disk.frame, factor data type", {
+#   iris.df = as.disk.frame(sample_n(iris, nrow(iris)), nchunks = 2)
+#   iris_hard.df = hard_arrange(iris.df, Species)
+# 
+#   expect_true(!is.unsorted(iris_hard.df$Species))  
+# })
+# 
+# test_that("test hard_arrange on disk.frame, date data type", {
+#   dff = csv_to_disk.frame(
+#     file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+#     file.path(tempdir(), "tmp_pls_delete_gb.df"))
+#   sorted_dff <- dff %>% hard_arrange(date1)
+#   
+#   expect_true(!is.unsorted(sorted_dff$date1))    
+# })
+# 
+# test_that("test hard_arrange on disk.frame, two and three variables", {   
+#   dff = csv_to_disk.frame(
+#     file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+#     file.path(tempdir(), "tmp_pls_delete_gb.df"))
+#   
+#   dfp <- read.csv(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+#   
+#   # Sort ascending, two levels
+#   sorted_dff <- dff %>% hard_arrange(id1, id4) %>% collect
+#   sorted_dfp <- dff %>% collect %>% dplyr::arrange(id1, id4) 
+#   
+#   # Compare vs dplyr
+#   expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
+#   expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+#   
+#   # Sort ascending, three levels, from already partially sorted disk frame
+#   sorted_dff2 <- sorted_dff %>% hard_arrange(id1, id4, id6) %>% collect
+#   sorted_dfp2 <- dff %>% collect %>% dplyr::arrange(id1, id4, id6) 
+#   
+#   # Compare vs dplyr
+#   expect_true(all(sorted_dff2$id1 == sorted_dfp2$id1))
+#   expect_true(all(sorted_dff2$id4 == sorted_dfp2$id4))
+#   expect_true(all(sorted_dff2$id6 == sorted_dfp2$id6))  
+# })
+# 
+# test_that("test hard_arrange on disk.frame, two factors", { 
+#   dff = csv_to_disk.frame(
+#     file.path(tempdir(), "tmp_pls_delete_gb.csv"), 
+#     file.path(tempdir(), "tmp_pls_delete_gb.df"))
+#     
+#   # Sort decending, two levels
+#   desc_dff <- dff %>% hard_arrange(desc(id4), id2)
+#   desc_dff <- desc_dff %>% collect
+#   
+#   #  Level 1
+#   expect_true(!is.unsorted(-desc_dff$id4))
+#   
+#   #  Level 2
+#   desc_dff$id4_id2 <- paste0(
+#     formatC(max(desc_dff$id4) - desc_dff$id4, width=3, format="d", flag= "0"), 
+#     desc_dff$id2)
+#   expect_true(!is.unsorted(-desc_dff$id4))
+# })
+# 
+# test_that("test hard_arrange on data.frame vs dplyr", {
+#   df = disk.frame:::gen_datatable_synthetic(1e3+11)
+#   
+#   # Sort ascending
+#   sorted_dff <- df %>% hard_arrange(id1, id4) %>% collect
+#   sorted_dfp <- df %>% dplyr::arrange(id1, id4)
+#   
+#   expect_true(all(sorted_dff$id1 == sorted_dfp$id1))
+#   expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+#   
+#   # Sort decending
+#   desc_dff <- df %>% hard_arrange(desc(id4), id2) %>% collect
+#   desc_dfp <- df %>% dplyr::arrange(desc(id4), id2) 
+#   
+#   expect_true(all(sorted_dff$id4 == sorted_dfp$id4))
+#   expect_true(all(sorted_dff$id2 == sorted_dfp$dfp))  
+# })
+# 
+# teardown({
+#   fs::file_delete(file.path(tempdir(), "tmp_pls_delete_gb.csv"))
+#   fs::dir_delete(file.path(tempdir(), "tmp_pls_delete_gb.df"))
+# })
\ No newline at end of file
diff --git a/tests/testthat/test-left_join.R b/tests/testthat/test-left_join.R
index e08e58b1..2965f836 100644
--- a/tests/testthat/test-left_join.R
+++ b/tests/testthat/test-left_join.R
@@ -1,6 +1,7 @@
 context("test-left_join")
 
 setup({
+  setup_disk.frame(2)
   a = data.frame(a = 1:100, b = 1:100)
   b = data.frame(a = 51:150, b = 1:100)
   d = data.frame(a = 1:50, b = 1:50)
diff --git a/tests/testthat/test-rechunk.r b/tests/testthat/test-rechunk.r
index 68f59938..af6e3ccb 100644
--- a/tests/testthat/test-rechunk.r
+++ b/tests/testthat/test-rechunk.r
@@ -71,8 +71,19 @@ test_that("testing rechunk 5 to 7", {
   expect_equal(res$a, 51:150)
 })
 
-# TODO do shardby; it's kinda of mitigated by thorough testing on Fannie Mae
-
+test_that("testing reshard", {
+  b = data.frame(a = 51:150, b = 1:100)
+  b = as.disk.frame(b, file.path(tempdir(), "tmp_rechunks5.df"), overwrite = T)
+  
+  b = rechunk(b, shardby = "b")
+  expect_equal(nrow(b), 100)
+  expect_equal(ncol(b), 2)
+  
+  res = collect(b)[order(b)]
+  
+  expect_equal(res$b, 1:100)
+  expect_equal(res$a, 51:150)
+})
 
 teardown({
   fs::dir_delete(file.path(tempdir(), "tmp_rechunks.df"))
diff --git a/tests/testthat/test-sql_query.r b/tests/testthat/test-sql_query.r
index 7a270767..7cf89fa0 100644
--- a/tests/testthat/test-sql_query.r
+++ b/tests/testthat/test-sql_query.r
@@ -2,20 +2,20 @@ context("test-sql-query")
 
 test_that("testing sql_query", {
   ## setup a dummy database
-  library(RSQLite)
-  library(DBI)
-
-  con <- dbConnect(RSQLite::SQLite(), ":memory:")
-  
-  dbWriteTable(con, "iris", iris)
-  
-  diskf1 <- sql_query_to_disk.frame(con, "select * from iris")
-  
-  diskf2 <- db_table_to_disk.frame(con, "iris")
-  
-  testthat::expect_equal(nrow(diskf1), 150)
-  testthat::expect_equal(nrow(diskf2), 150)
-  
-  DBI::dbDisconnect(con)
-  
+  # library(RSQLite)
+  # library(DBI)
+  # 
+  # con <- dbConnect(RSQLite::SQLite(), ":memory:")
+  # 
+  # dbWriteTable(con, "iris", iris)
+  # 
+  # diskf1 <- sql_query_to_disk.frame(con, "select * from iris")
+  # 
+  # diskf2 <- db_table_to_disk.frame(con, "iris")
+  # 
+  # testthat::expect_equal(nrow(diskf1), 150)
+  # testthat::expect_equal(nrow(diskf2), 150)
+  # 
+  # DBI::dbDisconnect(con)
+  # 
 })
diff --git a/tests/testthat/test-srckeep.r b/tests/testthat/test-srckeep.r
index 5b6fa370..87f3e93a 100644
--- a/tests/testthat/test-srckeep.r
+++ b/tests/testthat/test-srckeep.r
@@ -1,4 +1,4 @@
-context("test-keep")
+context("test-srckeep")
 
 setup({
   b = data.frame(a = 51:150, b = 1:100)

From edcb4fc51c6648d68abd5d36f230361d3427062e Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Sun, 30 Jan 2022 23:25:21 +1100
Subject: [PATCH 7/9] before merge

---
 .Rbuildignore | 1 +
 DESCRIPTION   | 6 ++----
 2 files changed, 3 insertions(+), 4 deletions(-)

diff --git a/.Rbuildignore b/.Rbuildignore
index f79a88c1..de0faa12 100644
--- a/.Rbuildignore
+++ b/.Rbuildignore
@@ -68,3 +68,4 @@ vignettes.Rnw.template
 new-nse-dev.r
 test-poorman.R
 .parquet$
+maditr-devs.r
\ No newline at end of file
diff --git a/DESCRIPTION b/DESCRIPTION
index 0307f9a4..308a3630 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -1,7 +1,7 @@
 Type: Package
 Package: disk.frame
 Title: Larger-than-RAM Disk-Based Data Manipulation Framework
-Version: 0.5.0
+Version: 0.6.0
 Date: 2021-05-09
 Authors@R: c(
   person("Dai", "ZJ", email = "zhuojia.dai@gmail.com", role = c("aut", "cre")),
@@ -37,7 +37,6 @@ Depends:
     dplyr (>= 1.0.0),
     purrr (>= 0.3.2)
 Suggests:
-    testthat (>= 2.1.0),
     nycflights13,
     magrittr,
     shiny,
@@ -48,8 +47,7 @@ Suggests:
     biglmm,
     speedglm,
     broom,
-    ggplot2,
-    covr
+    ggplot2
 LinkingTo: 
     Rcpp
 RoxygenNote: 7.1.2

From 8e0f47b110082c4b03356cae82aead7fa8a77b86 Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Mon, 31 Jan 2022 00:47:59 +1100
Subject: [PATCH 8/9] updated site

---
 DESCRIPTION                                  |   6 +-
 NEWS.md                                      |   5 +
 R/anti_join.r                                |   2 +
 R/bind_rows.r                                |   2 +-
 R/cmap.r                                     |   6 +-
 R/csv2disk.frame.r                           |   2 +-
 R/map_by_chunk_id.r                          |   2 +-
 R/rechunk.r                                  |   3 -
 R/shard.r                                    |   3 -
 R/zip_to_disk.frame.r                        |   1 +
 README.md                                    |  38 +--
 book/02-intro-disk-frame.Rmd                 |  54 ++---
 docs/404.html                                |   2 +-
 docs/LICENSE-text.html                       |   2 +-
 docs/articles/01-intro.html                  |   2 +-
 docs/articles/02-intro-disk-frame.html       | 139 ++++-------
 docs/articles/03-concepts.html               |   6 +-
 docs/articles/04-ingesting-data.html         |   2 +-
 docs/articles/05-data-table-syntax.html      |   7 +-
 docs/articles/06-vs-dask-juliadb.html        |  11 +-
 docs/articles/07-glm.html                    |   2 +-
 docs/articles/08-more-epic.html              |   2 +-
 docs/articles/09-convenience-features.html   |   2 +-
 docs/articles/10-group-by.html               |   6 +-
 docs/articles/11-custom-group-by.html        |   2 +-
 docs/articles/88-trouble-shooting.html       |   2 +-
 docs/articles/index.html                     |   2 +-
 docs/authors.html                            |   6 +-
 docs/index.html                              |  40 +--
 docs/news/index.html                         |   9 +-
 docs/pkgdown.yml                             |   2 +-
 docs/reference/add_chunk.html                |  18 +-
 docs/reference/as.data.frame.disk.frame.html |   2 +-
 docs/reference/as.data.table.disk.frame.html |   5 +-
 docs/reference/as.disk.frame.html            |   2 +-
 docs/reference/bind_rows.disk.frame.html     | 131 ++++++++++
 docs/reference/chunk_group_by.html           |  27 ++-
 docs/reference/cmap.html                     | 241 ++-----------------
 docs/reference/cmap2.html                    |   4 +-
 docs/reference/collect.html                  |  13 +-
 docs/reference/colnames.html                 |   2 +-
 docs/reference/compute.disk.frame.html       |  20 +-
 docs/reference/create_chunk_mapper.html      |   4 +-
 docs/reference/csv_to_disk.frame.html        |   5 +-
 docs/reference/delete.html                   |   2 +-
 docs/reference/df_ram_size.html              |   2 +-
 docs/reference/dfglm.html                    |   2 +-
 docs/reference/disk.frame.html               |   6 +-
 docs/reference/dplyr_verbs.html              |   7 +-
 docs/reference/evalparseglue.html            |   2 +-
 docs/reference/foverlaps.disk.frame.html     |   2 +-
 docs/reference/gen_datatable_synthetic.html  |   2 +-
 docs/reference/get_chunk.html                |   2 +-
 docs/reference/get_chunk_ids.html            |  14 +-
 docs/reference/group_by.html                 |  11 +-
 docs/reference/groups.disk.frame.html        |   2 +-
 docs/reference/head_tail.html                |   2 +-
 docs/reference/index.html                    |  41 ++--
 docs/reference/is_disk.frame.html            |   2 +-
 docs/reference/join.html                     |  44 +---
 docs/reference/make_glm_streaming_fn.html    |   2 +-
 docs/reference/merge.disk.frame.html         |   2 +-
 docs/reference/move_to.html                  |   2 +-
 docs/reference/nchunks.html                  |   2 +-
 docs/reference/ncol_nrow.html                |   2 +-
 docs/reference/one-stage-group-by-verbs.html |   2 +-
 docs/reference/overwrite_check.html          |   2 +-
 docs/reference/play.html                     | 133 ++++++++++
 docs/reference/print.disk.frame.html         |   2 +-
 docs/reference/pull.disk.frame.html          |   2 +-
 docs/reference/purrr_as_mapper.html          | 131 ++++++++++
 docs/reference/rbindlist.disk.frame.html     |   4 +-
 docs/reference/rechunk.html                  |  24 +-
 docs/reference/recommend_nchunks.html        |   2 +-
 docs/reference/remove_chunk.html             |  14 +-
 docs/reference/sample.html                   |  44 ++--
 docs/reference/setup_disk.frame.html         |   2 +-
 docs/reference/shard.html                    |  14 +-
 docs/reference/shardkey.html                 |   2 +-
 docs/reference/shardkey_equal.html           |   2 +-
 docs/reference/show_ceremony.html            |   2 +-
 docs/reference/srckeep.html                  |   8 +-
 docs/reference/sub-.disk.frame.html          |  36 ++-
 docs/reference/tbl_vars.disk.frame.html      |   2 +-
 docs/reference/write_disk.frame.html         |  10 +-
 docs/reference/zip_to_disk.frame.html        |   4 +-
 docs/sitemap.xml                             |   9 +
 man/bind_rows.disk.frame.Rd                  |   2 +-
 man/cmap.Rd                                  |  11 +-
 man/join.Rd                                  |   4 +
 man/rechunk.Rd                               |   6 -
 man/shard.Rd                                 |   6 -
 92 files changed, 808 insertions(+), 669 deletions(-)
 create mode 100644 docs/reference/bind_rows.disk.frame.html
 create mode 100644 docs/reference/play.html
 create mode 100644 docs/reference/purrr_as_mapper.html

diff --git a/DESCRIPTION b/DESCRIPTION
index 0bb4f6cd..1ce9bbee 100644
--- a/DESCRIPTION
+++ b/DESCRIPTION
@@ -2,7 +2,7 @@ Type: Package
 Package: disk.frame
 Title: Larger-than-RAM Disk-Based Data Manipulation Framework
 Version: 0.6.0
-Date: 2022-01-30
+Date: 2022-01-31
 Authors@R: c(
   person("Dai", "ZJ", email = "zhuojia.dai@gmail.com", role = c("aut", "cre")),
   person("Jacky", "Poon", role = c("ctb"))
@@ -45,10 +45,12 @@ Suggests:
     biglmm,
     speedglm,
     broom,
-    ggplot2
+    ggplot2,
+    rmarkdown
 LinkingTo: 
     Rcpp
 RoxygenNote: 7.1.2
+VignetteBuilder: rmarkdown
 Encoding: UTF-8
 URL: https://diskframe.com
 BugReports: https://github.com/xiaodaigh/disk.frame/issues
diff --git a/NEWS.md b/NEWS.md
index 088222ce..e075c6da 100644
--- a/NEWS.md
+++ b/NEWS.md
@@ -1,3 +1,8 @@
+# disk.frame 0.6
+* Much better NSE support in disk.frame!
+* removed `hard_arrange` and `hard_group_by`
+* various API updates
+
 # disk.frame 0.5
 * removed `add_count` method
 
diff --git a/R/anti_join.r b/R/anti_join.r
index 91acffd9..2108bdf6 100644
--- a/R/anti_join.r
+++ b/R/anti_join.r
@@ -3,6 +3,8 @@
 #' @param merge_by_chunk_id the merge is performed by chunk id
 #' @param overwrite overwrite output directory
 #' @param .progress Show progress or not. Defaults to FALSE
+#' @param suffix see dplyr::XXX_join
+#' @param keep see dplyr::XXX_join
 #' @param ... same as dplyr's joins
 #' @rdname join
 #' @importFrom dplyr anti_join left_join full_join semi_join inner_join
diff --git a/R/bind_rows.r b/R/bind_rows.r
index bd5fbe76..59b6cf4b 100644
--- a/R/bind_rows.r
+++ b/R/bind_rows.r
@@ -1,5 +1,5 @@
 #' Bind rows
-#' @param ... 
+#' @param ... disk.frame to be row bound
 #' @export
 bind_rows.disk.frame <- function(...) {
   rbindlist.disk.frame(list(...))
diff --git a/R/cmap.r b/R/cmap.r
index f4eebe60..a9e578ce 100644
--- a/R/cmap.r
+++ b/R/cmap.r
@@ -6,6 +6,10 @@
 #' @param use.names for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
 #' @param fill for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
 #' @param idcol for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist
+#' @param .id ignored
+#' @param keep The columns to keep at source
+#' @param compress The compression setting. 0-100
+#' @param overwrite Whether to overwrite any files in the output directory
 #' @param ... Passed to `collect` and `write_disk.frame`
 #' @export
 #' @examples
@@ -82,7 +86,7 @@ cimap <- function(.x, .f, ...) {
 #' second is the chunk ID
 #' @export
 #' @rdname cmap
-cimap.disk.frame <- function(.x, .f, outdir = NULL, keep = NULL, chunks = nchunks(.x), compress = 50, lazy = TRUE, overwrite = FALSE, ...) {
+cimap.disk.frame <- function(.x, .f, outdir = NULL, keep = NULL, lazy = TRUE, overwrite = FALSE, compress=50, ...) {
   .f = purrr_as_mapper(.f)
   
   # TODO support lazy for cimap
diff --git a/R/csv2disk.frame.r b/R/csv2disk.frame.r
index 83acdaf0..ac929b77 100644
--- a/R/csv2disk.frame.r
+++ b/R/csv2disk.frame.r
@@ -306,7 +306,7 @@ csv_to_disk.frame_data.table_backend <- function(infile, outdir = tempfile(filee
       message("")
     }
     
-    outdf_tmp = future.apply::future_imap(1:length(infile), function(i) {
+    outdf_tmp = future.apply::future_lapply(1:length(infile), function(i) {
       dotdotdotorigarg1 = c(dotdotdotorigarg, list(outdir = file.path(tempdir(), i), infile=infile[i]))
       do.call(csv_to_disk.frame_data.table_backend, dotdotdotorigarg1)
     })
diff --git a/R/map_by_chunk_id.r b/R/map_by_chunk_id.r
index f446848a..32ee0d16 100644
--- a/R/map_by_chunk_id.r
+++ b/R/map_by_chunk_id.r
@@ -2,5 +2,5 @@
 #' @export
 map_by_chunk_id <- function(.x, .y, .f, ..., outdir) {
   warning("map_by_chunk_id is deprecated. Use map2 instead")
-  map2.disk.frame(.x, .y, .f, ..., outdir = outdir)
+  cmap2.disk.frame(.x, .y, .f, ..., outdir = outdir)
 }
\ No newline at end of file
diff --git a/R/rechunk.r b/R/rechunk.r
index 7b0e6db6..9b79ba80 100644
--- a/R/rechunk.r
+++ b/R/rechunk.r
@@ -4,9 +4,6 @@
 #' @param shardby the shardkeys
 #' @param outdir the output directory
 #' @param overwrite overwrite the output directory
-#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks
-#' @param sort_splits for the "sort" shardby function, a dataframe with the split values.
-#' @param desc_vars for the "sort" shardby function, the variables to sort descending.
 #' @export
 #' @examples
 #' # create a disk.frame with 2 chunks in tempdir()
diff --git a/R/shard.r b/R/shard.r
index 227897cc..42a94946 100644
--- a/R/shard.r
+++ b/R/shard.r
@@ -4,9 +4,6 @@
 #' @param nchunks The number of chunks
 #' @param outdir The output directory of the disk.frame
 #' @param overwrite If TRUE then the chunks are overwritten
-#' @param shardby_function splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks
-#' @param sort_splits If shardby_function is "sort", the split values for sharding
-#' @param desc_vars for the "sort" shardby function, the variables to sort descending.
 #' @param ... not used
 #' @importFrom data.table setDT
 #' @importFrom glue glue
diff --git a/R/zip_to_disk.frame.r b/R/zip_to_disk.frame.r
index ca253d1e..5aacdd5b 100644
--- a/R/zip_to_disk.frame.r
+++ b/R/zip_to_disk.frame.r
@@ -39,6 +39,7 @@ zip_to_disk.frame = function(zipfile, outdir, ..., validation.check = FALSE, ove
   
   tmpdir = tempfile(pattern = "tmp_zip2csv")
 
+  dotdotdots = list(...)
   dfs = future.apply::future_lapply(files$Name, function(fn, ...) {
     outdfpath = file.path(outdir, fn)
     overwrite_check(outdfpath, TRUE)
diff --git a/README.md b/README.md
index 8b8b1af9..2ca03010 100644
--- a/README.md
+++ b/README.md
@@ -190,7 +190,6 @@ library(nycflights13)
 
 # this will setup disk.frame's parallel backend with number of workers equal to the number of CPU cores (hyper-threaded cores are counted as one not two)
 setup_disk.frame()
-#> The number of workers available for disk.frame is 6
 # this allows large datasets to be transferred between sessions
 options(future.globals.maxSize = Inf)
 
@@ -211,12 +210,15 @@ flights.df %>%
   filter(year == 2013) %>% 
   mutate(origin_dest = paste0(origin, dest)) %>% 
   head(2)
-#>   year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier
-#> 1 2013     1   1      517            515         2      830            819        11      UA
-#> 2 2013     1   1      533            529         4      850            830        20      UA
-#>   flight tailnum origin dest air_time distance hour minute           time_hour origin_dest
-#> 1   1545  N14228    EWR  IAH      227     1400    5     15 2013-01-01 05:00:00      EWRIAH
-#> 2   1714  N24211    LGA  IAH      227     1416    5     29 2013-01-01 05:00:00      LGAIAH
+#>    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time
+#> 1: 2013     1   1      517            515         2      830            819
+#> 2: 2013     1   1      533            529         4      850            830
+#>    arr_delay carrier flight tailnum origin dest air_time distance hour minute
+#> 1:        11      UA   1545  N14228    EWR  IAH      227     1400    5     15
+#> 2:        20      UA   1714  N24211    LGA  IAH      227     1416    5     29
+#>              time_hour origin_dest
+#> 1: 2013-01-01 05:00:00      EWRIAH
+#> 2: 2013-01-01 05:00:00      LGAIAH
 ```
 
 ### Group-by
@@ -313,7 +315,7 @@ To find out where the disk.frame is stored on disk:
 ``` r
 # where is the disk.frame stored
 attr(flights.df, "path")
-#> [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpIlXNzn\\file568813b835a7.df"
+#> [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpQH7obF\\file42d452c32907.df"
 ```
 
 A number of data.frame functions are implemented for disk.frame
@@ -321,19 +323,23 @@ A number of data.frame functions are implemented for disk.frame
 ``` r
 # get first few rows
 head(flights.df, 1)
-#>    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier
-#> 1: 2013     1   1      517            515         2      830            819        11      UA
-#>    flight tailnum origin dest air_time distance hour minute           time_hour
-#> 1:   1545  N14228    EWR  IAH      227     1400    5     15 2013-01-01 05:00:00
+#>    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time
+#> 1: 2013     1   1      517            515         2      830            819
+#>    arr_delay carrier flight tailnum origin dest air_time distance hour minute
+#> 1:        11      UA   1545  N14228    EWR  IAH      227     1400    5     15
+#>              time_hour
+#> 1: 2013-01-01 05:00:00
 ```
 
 ``` r
 # get last few rows
 tail(flights.df, 1)
-#>    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier
-#> 1: 2013     9  30       NA            840        NA       NA           1020        NA      MQ
-#>    flight tailnum origin dest air_time distance hour minute           time_hour
-#> 1:   3531  N839MQ    LGA  RDU       NA      431    8     40 2013-09-30 08:00:00
+#>    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time
+#> 1: 2013     9  30       NA            840        NA       NA           1020
+#>    arr_delay carrier flight tailnum origin dest air_time distance hour minute
+#> 1:        NA      MQ   3531  N839MQ    LGA  RDU       NA      431    8     40
+#>              time_hour
+#> 1: 2013-09-30 08:00:00
 ```
 
 ``` r
diff --git a/book/02-intro-disk-frame.Rmd b/book/02-intro-disk-frame.Rmd
index 79428c3d..8d50bc8b 100644
--- a/book/02-intro-disk-frame.Rmd
+++ b/book/02-intro-disk-frame.Rmd
@@ -168,7 +168,7 @@ mutate(flights.df, speed = distance / air_time * 60) %>% collect %>% head(2)
 
 ### Examples of NOT fully supported `dplyr` verbs
 
-The `chunk_arrange` function arranges (sorts) each chunk but not the whole dataset. So use with caution. Similarly `chunk_summarise` creates summary variables within each chunk and hence also needs to be used with caution. In the Group By section, we demonstrate how to use `summarise` in the `disk.frame` context correctly with `hard_group_by`s.
+The `chunk_arrange` function arranges (sorts) each chunk but not the whole dataset. So use with caution. Similarly `chunk_summarise` creates summary variables within each chunk and hence also needs to be used with caution.
 
 ```{r}
 # this only sorts within each chunk
@@ -227,7 +227,7 @@ The `by` variables that were used to shard the dataset are called the `shardkey`
 
 ```{r}
 flights.df %>%
-  group_by(carrier) %>% # notice that hard_group_by needs to be set
+  group_by(carrier) %>% 
   summarize(count = n(), mean_dep_delay = mean(dep_delay, na.rm=T)) %>%  # mean follows normal R rules
   collect %>% 
   arrange(carrier)
@@ -256,11 +256,11 @@ left_join
 inner_join
 semi_join
 inner_join
-full_join # requires hard_group_by on both left and right
+full_join # requires rechunk on both left and right
 ```
-In all cases, the left dataset (`x`) must be a `disk.frame`, and the right dataset (`y`) can be either a `disk.frame` or a `data.frame`. If the right dataset is a `disk.frame` and the `shardkey`s are different between the two `disk.frame`s then two expensive `hard` `group_by` operations are performed *eagerly*, one on the left `disk.frame` and one on the right `disk.frame` to perform the joins correctly. 
+In all cases, the left dataset (`x`) must be a `disk.frame`, and the right dataset (`y`) can be either a `disk.frame` or a `data.frame`. If the right dataset is a `disk.frame` and the `shardkey`s are different between the two `disk.frame`s then two expensive `hard` `rechunk` operations are performed *eagerly*, one on the left `disk.frame` and one on the right `disk.frame` to perform the joins correctly. 
 
-However, if the right dataset is a `data.frame` then `hard_group_by`s are only performed in the case of `full_join`.
+However, if the right dataset is a `data.frame` then `rechunk``s are only performed in the case of `full_join`.
 
 Note `disk.frame` does not support `right_join` the user should use `left_join` instead.
 
@@ -287,33 +287,7 @@ flights.df %>%
 
 `{disk.frame}` supports all `data.frame` operations, unlike Spark which can only perform those operations that Spark has implemented. Hence windowing functions like `min_rank` and `rank` are supported out of the box. 
 
-For the following example, we will use the `hard_group_by` which performs a group-by and also reorganises the chunks so that all records with the same `year`, `month`, and `day` end up in the same chunk. This is typically not advised, as `hard_group_by` can be slow for large datasets.
-
-```{r}
-# Find the most and least delayed flight each day
-bestworst <- flights.df %>%
-   srckeep(c("year","month","day", "dep_delay")) %>%
-   hard_group_by(c("year", "month", "day")) %>%
-   filter(dep_delay == min(dep_delay, na.rm = T) || dep_delay == max(dep_delay, na.rm = T)) %>%
-   collect
-   
-bestworst %>% head
-```
-
-another example
-
-```{r}
-ranked <- flights.df %>%
-  srckeep(c("year","month","day", "dep_delay")) %>%
-  hard_group_by(c("year", "month", "day")) %>%
-  filter(min_rank(desc(dep_delay)) <= 2 & dep_delay > 0) %>%
-  collect
-
-ranked %>% head
-```
-
-one more example
-
+For example
 ```{r}
 # Rank each flight within a daily
 ranked <- flights.df %>%
@@ -329,22 +303,22 @@ ranked %>% head
 
 ## Arbitrary by-chunk processing
 
-One can apply arbitrary transformations to each chunk of the `disk.frame` by using the `delayed` function which evaluates lazily or the `map.disk.frame(lazy = F)` function which evaluates eagerly. For example to return the number of rows in each chunk
+One can apply arbitrary transformations to each chunk of the `disk.frame` by using the `delayed` function which evaluates lazily or the `cmap.disk.frame(lazy = F)` function which evaluates eagerly. For example to return the number of rows in each chunk
 
 ```{r}
 flights.df1 <- delayed(flights.df, ~nrow(.x))
 collect_list(flights.df1) %>% head # returns number of rows for each data.frame in a list
 ```
-and to do the same with `map.disk.frame`
+and to do the same with `cmap.disk.frame`
 
 ```{r}
-map(flights.df, ~nrow(.x), lazy = F) %>% head
+cmap(flights.df, ~nrow(.x), lazy = F) %>% head
 ```
-The `map` function can also output the results to another disk.frame folder, e.g.
+The `cmap` function can also output the results to another disk.frame folder, e.g.
 
 ```{r}
 # return the first 10 rows of each chunk
-flights.df2 <- map(flights.df, ~.x[1:10,], lazy = F, outdir = file.path(tempdir(), "tmp2"), overwrite = T)
+flights.df2 <- cmap(flights.df, ~.x[1:10,], lazy = F, outdir = file.path(tempdir(), "tmp2"), overwrite = T)
 
 flights.df2 %>% head
 ```
@@ -369,7 +343,7 @@ write_disk.frame(flights.df, outdir="out")
 this will output a disk.frame to the folder "out"
 
 ```{r cleanup, include=FALSE}
-fs::dir_delete(file.path(tempdir(), "tmp_flights.df"))
-fs::dir_delete(file.path(tempdir(), "tmp2"))
-fs::file_delete(file.path(tempdir(), "tmp_flights.csv"))
+# fs::dir_delete(file.path(tempdir(), "tmp_flights.df"))
+# fs::dir_delete(file.path(tempdir(), "tmp2"))
+# fs::file_delete(file.path(tempdir(), "tmp_flights.csv"))
 ```
diff --git a/docs/404.html b/docs/404.html
index 78100fa4..9ccac74e 100644
--- a/docs/404.html
+++ b/docs/404.html
@@ -32,7 +32,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/LICENSE-text.html b/docs/LICENSE-text.html
index abba5cc8..5757cc4b 100644
--- a/docs/LICENSE-text.html
+++ b/docs/LICENSE-text.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/01-intro.html b/docs/articles/01-intro.html
index 584809c3..af353427 100644
--- a/docs/articles/01-intro.html
+++ b/docs/articles/01-intro.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/02-intro-disk-frame.html b/docs/articles/02-intro-disk-frame.html
index fec5669f..5526ed10 100644
--- a/docs/articles/02-intro-disk-frame.html
+++ b/docs/articles/02-intro-disk-frame.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -211,12 +211,13 @@ <h4 id="creating-a-disk-frame-from-csv">Creating a <code>disk.frame</code> from
   <span class="va">csv_path</span>, 
   outdir <span class="op">=</span> <span class="va">df_path</span>, 
   in_chunk_size <span class="op">=</span> <span class="fl">100000</span><span class="op">)</span>
-<span class="co">#&gt; Warning: UNRELIABLE VALUE: Future ('&lt;none&gt;') unexpectedly generated random</span>
-<span class="co">#&gt; numbers without specifying argument 'seed'. There is a risk that those random</span>
-<span class="co">#&gt; numbers are not statistically sound and the overall results might be invalid.</span>
-<span class="co">#&gt; To fix this, specify 'seed=TRUE'. This ensures that proper, parallel-safe random</span>
-<span class="co">#&gt; numbers are produced via the L'Ecuyer-CMRG method. To disable this check, use</span>
-<span class="co">#&gt; 'seed=NULL', or set option 'future.rng.onMisuse' to "ignore".</span>
+<span class="co">#&gt; Warning: UNRELIABLE VALUE: One of the 'future.apply' iterations</span>
+<span class="co">#&gt; ('future_lapply-1') unexpectedly generated random numbers without declaring so.</span>
+<span class="co">#&gt; There is a risk that those random numbers are not statistically sound and the</span>
+<span class="co">#&gt; overall results might be invalid. To fix this, specify 'future.seed=TRUE'. This</span>
+<span class="co">#&gt; ensures that proper, parallel-safe random numbers are produced via the L'Ecuyer-</span>
+<span class="co">#&gt; CMRG method. To disable this check, use 'future.seed = NULL', or set option</span>
+<span class="co">#&gt; 'future.rng.onMisuse' to "ignore".</span>
   
 <span class="va">flights.df</span></code></pre></div>
 <p><code>disk.frame</code> also has a function <code>zip_to_disk.frame</code> that can convert every CSV in a zip file to <code>disk.frame</code>s.</p>
@@ -265,7 +266,7 @@ <h4 id="simple-dplyr-verbs-and-lazy-evaluation">Simple <code>dplyr</code> verbs
 <div class="section level4">
 <h4 id="examples-of-not-fully-supported-dplyr-verbs">Examples of NOT fully supported <code>dplyr</code> verbs<a class="anchor" aria-label="anchor" href="#examples-of-not-fully-supported-dplyr-verbs"></a>
 </h4>
-<p>The <code>chunk_arrange</code> function arranges (sorts) each chunk but not the whole dataset. So use with caution. Similarly <code>chunk_summarise</code> creates summary variables within each chunk and hence also needs to be used with caution. In the Group By section, we demonstrate how to use <code>summarise</code> in the <code>disk.frame</code> context correctly with <code>hard_group_by</code>s.</p>
+<p>The <code>chunk_arrange</code> function arranges (sorts) each chunk but not the whole dataset. So use with caution. Similarly <code>chunk_summarise</code> creates summary variables within each chunk and hence also needs to be used with caution.</p>
 <div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># this only sorts within each chunk</span>
 <span class="fu"><a href="../reference/dplyr_verbs.html">chunk_arrange</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/desc.html" class="external-link">desc</a></span><span class="op">(</span><span class="va">dep_delay</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">collect</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="fl">2</span><span class="op">)</span>
@@ -342,7 +343,7 @@ <h3 id="group-by">Group-by<a class="anchor" aria-label="anchor" href="#group-by"
 <p><a href="https://diskframe.com" class="external-link">disk.frame</a> implements the <code>group_by</code> operation some caveats. In the <a href="https://diskframe.com" class="external-link">disk.frame</a> framework, only a set functions are supported in <code>summarize</code>. However, the user can create more custom <code>group-by</code> functions can be defined.</p>
 <div class="sourceCode" id="cb16"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="fu"><a href="https://dplyr.tidyverse.org/reference/group_by.html" class="external-link">group_by</a></span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="co"># notice that hard_group_by needs to be set</span>
+  <span class="fu"><a href="https://dplyr.tidyverse.org/reference/group_by.html" class="external-link">group_by</a></span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/summarise.html" class="external-link">summarize</a></span><span class="op">(</span>count <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/context.html" class="external-link">n</a></span><span class="op">(</span><span class="op">)</span>, mean_dep_delay <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/mean.html" class="external-link">mean</a></span><span class="op">(</span><span class="va">dep_delay</span>, na.rm<span class="op">=</span><span class="cn">T</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>  <span class="co"># mean follows normal R rules</span>
   <span class="va">collect</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/arrange.html" class="external-link">arrange</a></span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span>
@@ -406,9 +407,9 @@ <h3 id="joins">Joins<a class="anchor" aria-label="anchor" href="#joins"></a>
 <span class="va">inner_join</span>
 <span class="va">semi_join</span>
 <span class="va">inner_join</span>
-<span class="va">full_join</span> <span class="co"># requires hard_group_by on both left and right</span></code></pre></div>
-<p>In all cases, the left dataset (<code>x</code>) must be a <code>disk.frame</code>, and the right dataset (<code>y</code>) can be either a <code>disk.frame</code> or a <code>data.frame</code>. If the right dataset is a <code>disk.frame</code> and the <code>shardkey</code>s are different between the two <code>disk.frame</code>s then two expensive <code>hard</code> <code>group_by</code> operations are performed <em>eagerly</em>, one on the left <code>disk.frame</code> and one on the right <code>disk.frame</code> to perform the joins correctly.</p>
-<p>However, if the right dataset is a <code>data.frame</code> then <code>hard_group_by</code>s are only performed in the case of <code>full_join</code>.</p>
+<span class="va">full_join</span> <span class="co"># requires rechunk on both left and right</span></code></pre></div>
+<p>In all cases, the left dataset (<code>x</code>) must be a <code>disk.frame</code>, and the right dataset (<code>y</code>) can be either a <code>disk.frame</code> or a <code>data.frame</code>. If the right dataset is a <code>disk.frame</code> and the <code>shardkey</code>s are different between the two <code>disk.frame</code>s then two expensive <code>hard</code> <code>rechunk</code> operations are performed <em>eagerly</em>, one on the left <code>disk.frame</code> and one on the right <code>disk.frame</code> to perform the joins correctly.</p>
+<p>However, if the right dataset is a <code>data.frame</code> then <code>rechunk``s are only performed in the case of</code>full_join`.</p>
 <p>Note <code>disk.frame</code> does not support <code>right_join</code> the user should use <code>left_join</code> instead.</p>
 <p>The below joins are performed <em>lazily</em> because <code>airlines.dt</code> is a <code>data.table</code> not a <code>disk.frame</code>:</p>
 <div class="sourceCode" id="cb19"><pre class="downlit sourceCode r">
@@ -471,41 +472,8 @@ <h3 id="joins">Joins<a class="anchor" aria-label="anchor" href="#joins"></a>
 <h3 id="window-functions-and-arbitrary-functions">Window functions and arbitrary functions<a class="anchor" aria-label="anchor" href="#window-functions-and-arbitrary-functions"></a>
 </h3>
 <p><a href="https://diskframe.com" class="external-link">disk.frame</a> supports all <code>data.frame</code> operations, unlike Spark which can only perform those operations that Spark has implemented. Hence windowing functions like <code>min_rank</code> and <code>rank</code> are supported out of the box.</p>
-<p>For the following example, we will use the <code>hard_group_by</code> which performs a group-by and also reorganises the chunks so that all records with the same <code>year</code>, <code>month</code>, and <code>day</code> end up in the same chunk. This is typically not advised, as <code>hard_group_by</code> can be slow for large datasets.</p>
+<p>For example</p>
 <div class="sourceCode" id="cb21"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span class="co"># Find the most and least delayed flight each day</span>
-<span class="va">bestworst</span> <span class="op">&lt;-</span> <span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-   <span class="fu"><a href="../reference/srckeep.html">srckeep</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>,<span class="st">"month"</span>,<span class="st">"day"</span>, <span class="st">"dep_delay"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-   <span class="fu"><a href="../reference/hard_group_by.html">hard_group_by</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>, <span class="st">"month"</span>, <span class="st">"day"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">dep_delay</span> <span class="op">==</span> <span class="fu"><a href="https://rdrr.io/r/base/Extremes.html" class="external-link">min</a></span><span class="op">(</span><span class="va">dep_delay</span>, na.rm <span class="op">=</span> <span class="cn">T</span><span class="op">)</span> <span class="op">||</span> <span class="va">dep_delay</span> <span class="op">==</span> <span class="fu"><a href="https://rdrr.io/r/base/Extremes.html" class="external-link">max</a></span><span class="op">(</span><span class="va">dep_delay</span>, na.rm <span class="op">=</span> <span class="cn">T</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-   <span class="va">collect</span>
-   
-<span class="va">bestworst</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
-<span class="co">#&gt;    year month day dep_delay</span>
-<span class="co">#&gt; 1: 2013     2  21       301</span>
-<span class="co">#&gt; 2: 2013     2  21        -9</span>
-<span class="co">#&gt; 3: 2013     2  21        -1</span>
-<span class="co">#&gt; 4: 2013     2  21         2</span>
-<span class="co">#&gt; 5: 2013     2  21        -4</span>
-<span class="co">#&gt; 6: 2013     2  21        10</span></code></pre></div>
-<p>another example</p>
-<div class="sourceCode" id="cb22"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span class="va">ranked</span> <span class="op">&lt;-</span> <span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="fu"><a href="../reference/srckeep.html">srckeep</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>,<span class="st">"month"</span>,<span class="st">"day"</span>, <span class="st">"dep_delay"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="fu"><a href="../reference/hard_group_by.html">hard_group_by</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>, <span class="st">"month"</span>, <span class="st">"day"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/ranking.html" class="external-link">min_rank</a></span><span class="op">(</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/desc.html" class="external-link">desc</a></span><span class="op">(</span><span class="va">dep_delay</span><span class="op">)</span><span class="op">)</span> <span class="op">&lt;=</span> <span class="fl">2</span> <span class="op">&amp;</span> <span class="va">dep_delay</span> <span class="op">&gt;</span> <span class="fl">0</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="va">collect</span>
-
-<span class="va">ranked</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
-<span class="co">#&gt;    year month day dep_delay</span>
-<span class="co">#&gt; 1: 2013     1   9      1301</span>
-<span class="co">#&gt; 2: 2013     1   9       253</span>
-<span class="co">#&gt; 3: 2013     1  10      1126</span>
-<span class="co">#&gt; 4: 2013     1  10       385</span>
-<span class="co">#&gt; 5: 2013     1  17       259</span>
-<span class="co">#&gt; 6: 2013     1  17       255</span></code></pre></div>
-<p>one more example</p>
-<div class="sourceCode" id="cb23"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># Rank each flight within a daily</span>
 <span class="va">ranked</span> <span class="op">&lt;-</span> <span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
   <span class="fu"><a href="../reference/srckeep.html">srckeep</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>,<span class="st">"month"</span>,<span class="st">"day"</span>, <span class="st">"dep_delay"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
@@ -526,8 +494,8 @@ <h3 id="window-functions-and-arbitrary-functions">Window functions and arbitrary
 <div class="section level3">
 <h3 id="arbitrary-by-chunk-processing">Arbitrary by-chunk processing<a class="anchor" aria-label="anchor" href="#arbitrary-by-chunk-processing"></a>
 </h3>
-<p>One can apply arbitrary transformations to each chunk of the <code>disk.frame</code> by using the <code>delayed</code> function which evaluates lazily or the <code>map.disk.frame(lazy = F)</code> function which evaluates eagerly. For example to return the number of rows in each chunk</p>
-<div class="sourceCode" id="cb24"><pre class="downlit sourceCode r">
+<p>One can apply arbitrary transformations to each chunk of the <code>disk.frame</code> by using the <code>delayed</code> function which evaluates lazily or the <code>cmap.disk.frame(lazy = F)</code> function which evaluates eagerly. For example to return the number of rows in each chunk</p>
+<div class="sourceCode" id="cb22"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">flights.df1</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/cmap.html">delayed</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="op">~</span><span class="fu"><a href="../reference/ncol_nrow.html">nrow</a></span><span class="op">(</span><span class="va">.x</span><span class="op">)</span><span class="op">)</span>
 <span class="fu"><a href="../reference/collect.html">collect_list</a></span><span class="op">(</span><span class="va">flights.df1</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span> <span class="co"># returns number of rows for each data.frame in a list</span>
 <span class="co">#&gt; [[1]]</span>
@@ -547,35 +515,14 @@ <h3 id="arbitrary-by-chunk-processing">Arbitrary by-chunk processing<a class="an
 <span class="co">#&gt; </span>
 <span class="co">#&gt; [[6]]</span>
 <span class="co">#&gt; [1] 56121</span></code></pre></div>
-<p>and to do the same with <code>map.disk.frame</code></p>
-<div class="sourceCode" id="cb25"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span class="fu"><a href="../reference/cmap.html">map</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="op">~</span><span class="fu"><a href="../reference/ncol_nrow.html">nrow</a></span><span class="op">(</span><span class="va">.x</span><span class="op">)</span>, lazy <span class="op">=</span> <span class="cn">F</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
-<span class="co">#&gt; Warning in map.disk.frame(flights.df, ~nrow(.x), lazy = F): map(df, ...) where</span>
-<span class="co">#&gt; df is a disk.frame has been deprecated. Please use cmap(df,...) instead</span>
-<span class="co">#&gt; [[1]]</span>
-<span class="co">#&gt; [1] 56131</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt; [[2]]</span>
-<span class="co">#&gt; [1] 56131</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt; [[3]]</span>
-<span class="co">#&gt; [1] 56131</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt; [[4]]</span>
-<span class="co">#&gt; [1] 56131</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt; [[5]]</span>
-<span class="co">#&gt; [1] 56131</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt; [[6]]</span>
-<span class="co">#&gt; [1] 56121</span></code></pre></div>
-<p>The <code>map</code> function can also output the results to another disk.frame folder, e.g.</p>
-<div class="sourceCode" id="cb26"><pre class="downlit sourceCode r">
+<p>and to do the same with <code>cmap.disk.frame</code></p>
+<div class="sourceCode" id="cb23"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span class="fu"><a href="../reference/cmap.html">cmap</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="op">~</span><span class="fu"><a href="../reference/ncol_nrow.html">nrow</a></span><span class="op">(</span><span class="va">.x</span><span class="op">)</span>, lazy <span class="op">=</span> <span class="cn">F</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
+<span class="co">#&gt; [1] 6</span></code></pre></div>
+<p>The <code>cmap</code> function can also output the results to another disk.frame folder, e.g.</p>
+<div class="sourceCode" id="cb24"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># return the first 10 rows of each chunk</span>
-<span class="va">flights.df2</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/cmap.html">map</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">10</span>,<span class="op">]</span>, lazy <span class="op">=</span> <span class="cn">F</span>, outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/file.path.html" class="external-link">file.path</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempdir</a></span><span class="op">(</span><span class="op">)</span>, <span class="st">"tmp2"</span><span class="op">)</span>, overwrite <span class="op">=</span> <span class="cn">T</span><span class="op">)</span>
-<span class="co">#&gt; Warning in map.disk.frame(flights.df, ~.x[1:10, ], lazy = F, outdir =</span>
-<span class="co">#&gt; file.path(tempdir(), : map(df, ...) where df is a disk.frame has been</span>
-<span class="co">#&gt; deprecated. Please use cmap(df,...) instead</span>
+<span class="va">flights.df2</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/cmap.html">cmap</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">10</span>,<span class="op">]</span>, lazy <span class="op">=</span> <span class="cn">F</span>, outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/file.path.html" class="external-link">file.path</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempdir</a></span><span class="op">(</span><span class="op">)</span>, <span class="st">"tmp2"</span><span class="op">)</span>, overwrite <span class="op">=</span> <span class="cn">T</span><span class="op">)</span>
 
 <span class="va">flights.df2</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
 <span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time</span>
@@ -605,35 +552,35 @@ <h3 id="arbitrary-by-chunk-processing">Arbitrary by-chunk processing<a class="an
 <h3 id="sampling">Sampling<a class="anchor" aria-label="anchor" href="#sampling"></a>
 </h3>
 <p>In the <code>disk.frame</code> framework, sampling a proportion of rows within each chunk can be performed using <code>sample_frac</code>.</p>
-<div class="sourceCode" id="cb27"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb25"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/sample_n.html" class="external-link">sample_frac</a></span><span class="op">(</span><span class="fl">0.01</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">collect</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">head</span>
 <span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time</span>
-<span class="co">#&gt; 1: 2013     5  10      554            600        -6      645            659</span>
-<span class="co">#&gt; 2: 2013     8  28      752            800        -8     1015           1022</span>
-<span class="co">#&gt; 3: 2013     1   3      955            958        -3     1120           1137</span>
-<span class="co">#&gt; 4: 2013     8  22     2157           2100        57        7           2323</span>
-<span class="co">#&gt; 5: 2013     5  14     1853           1900        -7     2003           2048</span>
-<span class="co">#&gt; 6: 2013     8  25     1550           1540        10     1747           1747</span>
+<span class="co">#&gt; 1: 2013     1  10     1614           1605         9     1926           1944</span>
+<span class="co">#&gt; 2: 2013     5  13     1136           1136         0     1225           1234</span>
+<span class="co">#&gt; 3: 2013     5  16     1428           1420         8     1535           1538</span>
+<span class="co">#&gt; 4: 2013    12  29     1536           1520        16     1817           1750</span>
+<span class="co">#&gt; 5: 2013    12  21      849            820        29     1315           1345</span>
+<span class="co">#&gt; 6: 2013    12  25     1624           1559        25     1846           1825</span>
 <span class="co">#&gt;    arr_delay carrier flight tailnum origin dest air_time distance hour minute</span>
-<span class="co">#&gt; 1:       -14      US   2161  N747UW    LGA  DCA       38      214    6      0</span>
-<span class="co">#&gt; 2:        -7      UA    561  N513UA    LGA  DEN      218     1620    8      0</span>
-<span class="co">#&gt; 3:       -17      UA    258  N831UA    LGA  ORD      124      733    9     58</span>
-<span class="co">#&gt; 4:        44      DL   1247  N914DE    LGA  ATL      102      762   21      0</span>
-<span class="co">#&gt; 5:       -45      EV   5038  N741EV    LGA  BHM      111      866   19      0</span>
-<span class="co">#&gt; 6:         0      9E   3648  N8940E    JFK  CMH       69      483   15     40</span>
+<span class="co">#&gt; 1:       -18      DL   1508  N952DL    JFK  RSW      163     1074   16      5</span>
+<span class="co">#&gt; 2:        -9      EV   3830  N13955    EWR  PVD       35      160   11     36</span>
+<span class="co">#&gt; 3:        -3      EV   4284  N11536    EWR  ROC       45      246   14     20</span>
+<span class="co">#&gt; 4:        27      MQ   3553  N520MQ    LGA  XNA      181     1147   15     20</span>
+<span class="co">#&gt; 5:       -30      DL    454  N682DA    JFK  STT      188     1623    8     20</span>
+<span class="co">#&gt; 6:        21      EV   5567  N870AS    LGA  CAE       99      617   15     59</span>
 <span class="co">#&gt;              time_hour</span>
-<span class="co">#&gt; 1: 2013-05-10 10:00:00</span>
-<span class="co">#&gt; 2: 2013-08-28 12:00:00</span>
-<span class="co">#&gt; 3: 2013-01-03 14:00:00</span>
-<span class="co">#&gt; 4: 2013-08-23 01:00:00</span>
-<span class="co">#&gt; 5: 2013-05-14 23:00:00</span>
-<span class="co">#&gt; 6: 2013-08-25 19:00:00</span></code></pre></div>
+<span class="co">#&gt; 1: 2013-01-10 21:00:00</span>
+<span class="co">#&gt; 2: 2013-05-13 15:00:00</span>
+<span class="co">#&gt; 3: 2013-05-16 18:00:00</span>
+<span class="co">#&gt; 4: 2013-12-29 20:00:00</span>
+<span class="co">#&gt; 5: 2013-12-21 13:00:00</span>
+<span class="co">#&gt; 6: 2013-12-25 20:00:00</span></code></pre></div>
 </div>
 <div class="section level3">
 <h3 id="writing-data">Writing Data<a class="anchor" aria-label="anchor" href="#writing-data"></a>
 </h3>
 <p>One can output a <code>disk.frame</code> by using the <code>write_disk.frame</code> function. E.g.</p>
-<div class="sourceCode" id="cb28"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb26"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="fu"><a href="../reference/write_disk.frame.html">write_disk.frame</a></span><span class="op">(</span><span class="va">flights.df</span>, outdir<span class="op">=</span><span class="st">"out"</span><span class="op">)</span></code></pre></div>
 <p>this will output a disk.frame to the folder “out”</p>
 </div>
diff --git a/docs/articles/03-concepts.html b/docs/articles/03-concepts.html
index 418a1757..5797c66c 100644
--- a/docs/articles/03-concepts.html
+++ b/docs/articles/03-concepts.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -147,7 +147,6 @@ <h3 id="workers-and-parallelism">Workers and parallelism<a class="anchor" aria-l
 <span class="co">#&gt; The following objects are masked from 'package:base':</span>
 <span class="co">#&gt; </span>
 <span class="co">#&gt;     intersect, setdiff, setequal, union</span>
-<span class="co">#&gt; Loading required package: purrr</span>
 <span class="co">#&gt; </span>
 <span class="co"><span style="color: #BB0000;">#&gt; ## Message from disk.frame:</span></span>
 <span class="co"><span style="color: #BB0000;">#&gt; We have 1 workers to use with disk.frame.</span></span>
@@ -168,9 +167,6 @@ <h3 id="workers-and-parallelism">Workers and parallelism<a class="anchor" aria-l
 <span class="co"><span style="color: #00BB00;">#&gt; </span></span>
 <span class="co">#&gt; </span>
 <span class="co">#&gt; Attaching package: 'disk.frame'</span>
-<span class="co">#&gt; The following objects are masked from 'package:purrr':</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt;     imap, imap_dfr, map, map2</span>
 <span class="co">#&gt; The following objects are masked from 'package:base':</span>
 <span class="co">#&gt; </span>
 <span class="co">#&gt;     colnames, ncol, nrow</span>
diff --git a/docs/articles/04-ingesting-data.html b/docs/articles/04-ingesting-data.html
index eb86d829..d9e14783 100644
--- a/docs/articles/04-ingesting-data.html
+++ b/docs/articles/04-ingesting-data.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/05-data-table-syntax.html b/docs/articles/05-data-table-syntax.html
index c59cc037..7027aebf 100644
--- a/docs/articles/05-data-table-syntax.html
+++ b/docs/articles/05-data-table-syntax.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -149,9 +149,6 @@ <h2 id="disk-frame-supports-data-table-syntax">
 <code class="sourceCode R"><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va"><a href="https://r-datatable.com" class="external-link">data.table</a></span><span class="op">)</span>
 <span class="co">#&gt; </span>
 <span class="co">#&gt; Attaching package: 'data.table'</span>
-<span class="co">#&gt; The following object is masked from 'package:purrr':</span>
-<span class="co">#&gt; </span>
-<span class="co">#&gt;     transpose</span>
 <span class="co">#&gt; The following objects are masked from 'package:dplyr':</span>
 <span class="co">#&gt; </span>
 <span class="co">#&gt;     between, first, last</span>
@@ -167,6 +164,7 @@ <h2 id="disk-frame-supports-data-table-syntax">
 <span class="co">#&gt; [17] "hour"           "minute"         "time_hour"</span>
 
 <span class="va">flights.df</span><span class="op">[</span>,<span class="va">.N</span>, <span class="fu">.</span><span class="op">(</span><span class="va">year</span>, <span class="va">month</span><span class="op">)</span>, keep <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"year"</span>, <span class="st">"month"</span><span class="op">)</span><span class="op">]</span>
+<span class="co">#&gt; data.table syntax for disk.frame may be moved to a separate package in the future</span>
 <span class="co">#&gt;     year month     N</span>
 <span class="co">#&gt;  1: 2013     1 27004</span>
 <span class="co">#&gt;  2: 2013    10 28889</span>
@@ -199,6 +197,7 @@ <h3 id="external-variables-are-captured">External variables are captured<a class
 
 
 <span class="va">flights.df</span><span class="op">[</span>,<span class="fu">some_fn</span><span class="op">(</span><span class="va">y</span><span class="op">)</span><span class="op">]</span>
+<span class="co">#&gt; data.table syntax for disk.frame may be moved to a separate package in the future</span>
 <span class="co">#&gt; [1] 42 42 42 42 42 42</span></code></pre></div>
 <p>In the above example, neither <code>some_fn</code> nor <code>y</code> are defined in the background workers’ environments, but <code>disk.frame</code> still manages to evaluate this code <code>flights.df[,some_fn(y)]</code>.</p>
 </div>
diff --git a/docs/articles/06-vs-dask-juliadb.html b/docs/articles/06-vs-dask-juliadb.html
index 053e7c5e..fe2bcd28 100644
--- a/docs/articles/06-vs-dask-juliadb.html
+++ b/docs/articles/06-vs-dask-juliadb.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -189,21 +189,22 @@ <h5 id="disk-frame">disk.frame<a class="anchor" aria-label="anchor" href="#disk-
 <span class="fu"><a href="https://rdrr.io/r/base/system.time.html" class="external-link">system.time</a></span><span class="op">(</span><span class="fu"><a href="../reference/setup_disk.frame.html">setup_disk.frame</a></span><span class="op">(</span><span class="op">)</span><span class="op">)</span> <span class="co"># ~4s</span>
 <span class="co">#&gt; The number of workers available for disk.frame is 6</span>
 <span class="co">#&gt;    user  system elapsed </span>
-<span class="co">#&gt;    0.18    0.03    2.22</span></code></pre></div>
+<span class="co">#&gt;    0.20    0.03    2.32</span></code></pre></div>
 <p>We note that there is some time needed for disk.frame to start up all the workers. Next we try to convert the largest CSV file to disk.frame format. The file to be converted is about 2.2GB in size</p>
 <div class="sourceCode" id="cb6"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">time_to_convert_disk.frame</span> <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/system.time.html" class="external-link">system.time</a></span><span class="op">(</span><span class="va">df1</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/csv_to_disk.frame.html">csv_to_disk.frame</a></span><span class="op">(</span><span class="st">"c:/data/Performance_2004Q3.txt"</span>, header <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span><span class="op">)</span><span class="op">[</span><span class="fl">3</span><span class="op">]</span>
 
 <span class="va">time_to_convert_disk.frame</span>
 <span class="co">#&gt; elapsed </span>
-<span class="co">#&gt;   28.77</span></code></pre></div>
+<span class="co">#&gt;    28.3</span></code></pre></div>
 <p>Now that we have converted it, we want to a count by the first column. To achieve this we use a “two-stage” aggregation strategy. Note that use <code>keep="V1"</code> to bring only the column <code>V1</code> into RAM. This avoids the reading of other unnecessary columns and should speed-up the analysis significantly</p>
 <div class="sourceCode" id="cb7"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">time_to_agg_disk.frame</span> <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/system.time.html" class="external-link">system.time</a></span><span class="op">(</span><span class="va">summ</span> <span class="op">&lt;-</span> <span class="va">df1</span><span class="op">[</span>,<span class="va">.N</span>, <span class="va">V1</span>, keep <span class="op">=</span> <span class="st">"V1"</span><span class="op">]</span><span class="op">[</span>, <span class="fu">.</span><span class="op">(</span>N <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sum.html" class="external-link">sum</a></span><span class="op">(</span><span class="va">N</span><span class="op">)</span><span class="op">)</span>, <span class="va">V1</span><span class="op">]</span><span class="op">)</span>
+<span class="co">#&gt; data.table syntax for disk.frame may be moved to a separate package in the future</span>
 
 <span class="va">time_to_agg_disk.frame</span>
 <span class="co">#&gt;    user  system elapsed </span>
-<span class="co">#&gt;    0.13    0.03    7.89</span></code></pre></div>
+<span class="co">#&gt;    0.13    0.03    8.48</span></code></pre></div>
 <p>We can inspect the result as well.</p>
 <div class="sourceCode" id="cb8"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="va">summ</span>
@@ -227,7 +228,7 @@ <h5 id="disk-frame">disk.frame<a class="anchor" aria-label="anchor" href="#disk-
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/summarise.html" class="external-link">summarise</a></span><span class="op">(</span>N <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/context.html" class="external-link">n</a></span><span class="op">(</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="va">collect</span><span class="op">)</span>
 <span class="co">#&gt;    user  system elapsed </span>
-<span class="co">#&gt;    1.89    0.14    5.30</span></code></pre></div>
+<span class="co">#&gt;    1.53    0.17   10.25</span></code></pre></div>
 <p>However, the <code>dplyr</code> syntax tends to be slightly slower than using data.table syntax. This may be improved as much of the overhead is due to inefficient use of NSE.</p>
 </div>
 <div class="section level5">
diff --git a/docs/articles/07-glm.html b/docs/articles/07-glm.html
index 9a04cd64..2b340f3c 100644
--- a/docs/articles/07-glm.html
+++ b/docs/articles/07-glm.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/08-more-epic.html b/docs/articles/08-more-epic.html
index cfff702c..f4170f94 100644
--- a/docs/articles/08-more-epic.html
+++ b/docs/articles/08-more-epic.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/09-convenience-features.html b/docs/articles/09-convenience-features.html
index 81ab3af8..ef7bf2ed 100644
--- a/docs/articles/09-convenience-features.html
+++ b/docs/articles/09-convenience-features.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/10-group-by.html b/docs/articles/10-group-by.html
index c2799355..f18f3b51 100644
--- a/docs/articles/10-group-by.html
+++ b/docs/articles/10-group-by.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -298,7 +298,7 @@ <h3 id="group-by-notes">Group-by notes<a class="anchor" aria-label="anchor" href
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="fu"><a href="https://rdrr.io/r/base/message.html" class="external-link">suppressMessages</a></span><span class="op">(</span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va"><a href="https://diskframe.com" class="external-link">disk.frame</a></span><span class="op">)</span><span class="op">)</span>
 <span class="va">flights.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>
-  <span class="fu"><a href="../reference/hard_group_by.html">hard_group_by</a></span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="co"># notice that hard_group_by needs to be set</span>
+  <span class="fu">hard_group_by</span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="co"># notice that hard_group_by needs to be set</span>
   <span class="fu"><a href="../reference/chunk_group_by.html">chunk_summarize</a></span><span class="op">(</span>count <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/context.html" class="external-link">n</a></span><span class="op">(</span><span class="op">)</span>, mean_dep_delay <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/mean.html" class="external-link">mean</a></span><span class="op">(</span><span class="va">dep_delay</span>, na.rm<span class="op">=</span><span class="cn">T</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span>  <span class="co"># mean follows normal R rules</span>
   <span class="va">collect</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/arrange.html" class="external-link">arrange</a></span><span class="op">(</span><span class="va">carrier</span><span class="op">)</span></code></pre></div>
@@ -359,7 +359,7 @@ <h3 id="hard-group-by">Hard group-by<a class="anchor" aria-label="anchor" href="
   <span class="fu"><a href="../reference/srckeep.html">srckeep</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"month"</span>, <span class="st">"dep_delay"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">month</span> <span class="op">&lt;=</span> <span class="fl">6</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>qtr <span class="op">=</span> <span class="fu"><a href="https://Rdatatable.gitlab.io/data.table/reference/fifelse.html" class="external-link">ifelse</a></span><span class="op">(</span><span class="va">month</span> <span class="op">&lt;=</span> <span class="fl">3</span>, <span class="st">"Q1"</span>, <span class="st">"Q2"</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
-  <span class="fu"><a href="../reference/hard_group_by.html">hard_group_by</a></span><span class="op">(</span><span class="va">qtr</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="co"># hard group_by is MUCH SLOWER but avoid a 2nd stage aggregation</span>
+  <span class="fu">hard_group_by</span><span class="op">(</span><span class="va">qtr</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="co"># hard group_by is MUCH SLOWER but avoid a 2nd stage aggregation</span>
   <span class="fu"><a href="../reference/chunk_group_by.html">chunk_summarise</a></span><span class="op">(</span>avg_delay <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/mean.html" class="external-link">mean</a></span><span class="op">(</span><span class="va">dep_delay</span>, na.rm <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="va">collect</span>
 <span class="fu"><a href="https://rdrr.io/r/base/cat.html" class="external-link">cat</a></span><span class="op">(</span><span class="st">"group-by took: "</span>, <span class="fu">data.table</span><span class="fu">::</span><span class="fu"><a href="https://Rdatatable.gitlab.io/data.table/reference/timetaken.html" class="external-link">timetaken</a></span><span class="op">(</span><span class="va">pt</span><span class="op">)</span>, <span class="st">"\n"</span><span class="op">)</span>
diff --git a/docs/articles/11-custom-group-by.html b/docs/articles/11-custom-group-by.html
index 356dfa28..695f467f 100644
--- a/docs/articles/11-custom-group-by.html
+++ b/docs/articles/11-custom-group-by.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/88-trouble-shooting.html b/docs/articles/88-trouble-shooting.html
index ab2a72a9..e1ba2f47 100644
--- a/docs/articles/88-trouble-shooting.html
+++ b/docs/articles/88-trouble-shooting.html
@@ -33,7 +33,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/articles/index.html b/docs/articles/index.html
index f767f6f8..3e4cba20 100644
--- a/docs/articles/index.html
+++ b/docs/articles/index.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/authors.html b/docs/authors.html
index 342af2fa..97226196 100644
--- a/docs/authors.html
+++ b/docs/authors.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -110,13 +110,13 @@ <h1 id="citation">Citation</h1>
 
     <p>ZJ D (2022).
 <em>disk.frame: Larger-than-RAM Disk-Based Data Manipulation Framework</em>.
-R package version 0.5.0, <a href="https://diskframe.com" class="external-link">https://diskframe.com</a>. 
+R package version 0.6.0, <a href="https://diskframe.com" class="external-link">https://diskframe.com</a>. 
 </p>
     <pre>@Manual{,
   title = {disk.frame: Larger-than-RAM Disk-Based Data Manipulation Framework},
   author = {Dai ZJ},
   year = {2022},
-  note = {R package version 0.5.0},
+  note = {R package version 0.6.0},
   url = {https://diskframe.com},
 }</pre>
 
diff --git a/docs/index.html b/docs/index.html
index 89c4a22e..7ea2fc4e 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -37,7 +37,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -228,7 +228,6 @@ <h2 id="quick-start">Quick-start<a class="anchor" aria-label="anchor" href="#qui
 
 <span class="co"># this will setup disk.frame's parallel backend with number of workers equal to the number of CPU cores (hyper-threaded cores are counted as one not two)</span>
 <span class="fu"><a href="reference/setup_disk.frame.html">setup_disk.frame</a></span><span class="op">(</span><span class="op">)</span>
-<span class="co">#&gt; The number of workers available for disk.frame is 6</span>
 <span class="co"># this allows large datasets to be transferred between sessions</span>
 <span class="fu"><a href="https://rdrr.io/r/base/options.html" class="external-link">options</a></span><span class="op">(</span>future.globals.maxSize <span class="op">=</span> <span class="cn">Inf</span><span class="op">)</span>
 
@@ -248,12 +247,15 @@ <h3 id="dplyr-verbs">dplyr verbs<a class="anchor" aria-label="anchor" href="#dpl
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">year</span> <span class="op">==</span> <span class="fl">2013</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>origin_dest <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="va">origin</span>, <span class="va">dest</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> 
   <span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="fl">2</span><span class="op">)</span>
-<span class="co">#&gt;   year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier</span>
-<span class="co">#&gt; 1 2013     1   1      517            515         2      830            819        11      UA</span>
-<span class="co">#&gt; 2 2013     1   1      533            529         4      850            830        20      UA</span>
-<span class="co">#&gt;   flight tailnum origin dest air_time distance hour minute           time_hour origin_dest</span>
-<span class="co">#&gt; 1   1545  N14228    EWR  IAH      227     1400    5     15 2013-01-01 05:00:00      EWRIAH</span>
-<span class="co">#&gt; 2   1714  N24211    LGA  IAH      227     1416    5     29 2013-01-01 05:00:00      LGAIAH</span></code></pre></div>
+<span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time</span>
+<span class="co">#&gt; 1: 2013     1   1      517            515         2      830            819</span>
+<span class="co">#&gt; 2: 2013     1   1      533            529         4      850            830</span>
+<span class="co">#&gt;    arr_delay carrier flight tailnum origin dest air_time distance hour minute</span>
+<span class="co">#&gt; 1:        11      UA   1545  N14228    EWR  IAH      227     1400    5     15</span>
+<span class="co">#&gt; 2:        20      UA   1714  N24211    LGA  IAH      227     1416    5     29</span>
+<span class="co">#&gt;              time_hour origin_dest</span>
+<span class="co">#&gt; 1: 2013-01-01 05:00:00      EWRIAH</span>
+<span class="co">#&gt; 2: 2013-01-01 05:00:00      LGAIAH</span></code></pre></div>
 </div>
 <div class="section level3">
 <h3 id="group-by">Group-by<a class="anchor" aria-label="anchor" href="#group-by"></a>
@@ -403,22 +405,26 @@ <h2 id="basic-info">Basic info<a class="anchor" aria-label="anchor" href="#basic
 <div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># where is the disk.frame stored</span>
 <span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="st">"path"</span><span class="op">)</span>
-<span class="co">#&gt; [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpIlXNzn\\file568813b835a7.df"</span></code></pre></div>
+<span class="co">#&gt; [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpQH7obF\\file42d452c32907.df"</span></code></pre></div>
 <p>A number of data.frame functions are implemented for disk.frame</p>
 <div class="sourceCode" id="cb11"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># get first few rows</span>
 <span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="fl">1</span><span class="op">)</span>
-<span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier</span>
-<span class="co">#&gt; 1: 2013     1   1      517            515         2      830            819        11      UA</span>
-<span class="co">#&gt;    flight tailnum origin dest air_time distance hour minute           time_hour</span>
-<span class="co">#&gt; 1:   1545  N14228    EWR  IAH      227     1400    5     15 2013-01-01 05:00:00</span></code></pre></div>
+<span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time</span>
+<span class="co">#&gt; 1: 2013     1   1      517            515         2      830            819</span>
+<span class="co">#&gt;    arr_delay carrier flight tailnum origin dest air_time distance hour minute</span>
+<span class="co">#&gt; 1:        11      UA   1545  N14228    EWR  IAH      227     1400    5     15</span>
+<span class="co">#&gt;              time_hour</span>
+<span class="co">#&gt; 1: 2013-01-01 05:00:00</span></code></pre></div>
 <div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># get last few rows</span>
 <span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">tail</a></span><span class="op">(</span><span class="va">flights.df</span>, <span class="fl">1</span><span class="op">)</span>
-<span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier</span>
-<span class="co">#&gt; 1: 2013     9  30       NA            840        NA       NA           1020        NA      MQ</span>
-<span class="co">#&gt;    flight tailnum origin dest air_time distance hour minute           time_hour</span>
-<span class="co">#&gt; 1:   3531  N839MQ    LGA  RDU       NA      431    8     40 2013-09-30 08:00:00</span></code></pre></div>
+<span class="co">#&gt;    year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time</span>
+<span class="co">#&gt; 1: 2013     9  30       NA            840        NA       NA           1020</span>
+<span class="co">#&gt;    arr_delay carrier flight tailnum origin dest air_time distance hour minute</span>
+<span class="co">#&gt; 1:        NA      MQ   3531  N839MQ    LGA  RDU       NA      431    8     40</span>
+<span class="co">#&gt;              time_hour</span>
+<span class="co">#&gt; 1: 2013-09-30 08:00:00</span></code></pre></div>
 <div class="sourceCode" id="cb13"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span class="co"># number of rows</span>
 <span class="fu"><a href="reference/ncol_nrow.html">nrow</a></span><span class="op">(</span><span class="va">flights.df</span><span class="op">)</span>
diff --git a/docs/news/index.html b/docs/news/index.html
index 0fb5baf2..48d1c26d 100644
--- a/docs/news/index.html
+++ b/docs/news/index.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -90,6 +90,13 @@ <h1 data-toc-skip>Changelog <small></small></h1>
       <small>Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/NEWS.md" class="external-link"><code>NEWS.md</code></a></small>
     </div>
 
+    <div class="section level2">
+<h2 class="page-header" data-toc-text="0.6" id="diskframe-06">disk.frame 0.6<a class="anchor" aria-label="anchor" href="#diskframe-06"></a></h2>
+<ul><li>Much better NSE support in disk.frame!</li>
+<li>removed <code>hard_arrange</code> and <code>hard_group_by</code>
+</li>
+<li>various API updates</li>
+</ul></div>
     <div class="section level2">
 <h2 class="page-header" data-toc-text="0.5" id="diskframe-05">disk.frame 0.5<a class="anchor" aria-label="anchor" href="#diskframe-05"></a></h2>
 <ul><li>removed <code>add_count</code> method</li>
diff --git a/docs/pkgdown.yml b/docs/pkgdown.yml
index e9e64112..d6970ada 100644
--- a/docs/pkgdown.yml
+++ b/docs/pkgdown.yml
@@ -14,5 +14,5 @@ articles:
   10-group-by: 10-group-by.html
   11-custom-group-by: 11-custom-group-by.html
   88-trouble-shooting: 88-trouble-shooting.html
-last_built: 2022-01-24T10:36Z
+last_built: 2022-01-30T13:34Z
 
diff --git a/docs/reference/add_chunk.html b/docs/reference/add_chunk.html
index 82b43bf9..33227b07 100644
--- a/docs/reference/add_chunk.html
+++ b/docs/reference/add_chunk.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -135,19 +135,15 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># add a chunk to diskf</span></span>
 <span class="r-in"><span class="fu">add_chunk</span><span class="op">(</span><span class="va">diskf</span>, <span class="va">cars</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5/tmp_add_chunk"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm/tmp_add_chunk"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 1</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 50</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="fu">add_chunk</span><span class="op">(</span><span class="va">diskf</span>, <span class="va">cars</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5/tmp_add_chunk"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm/tmp_add_chunk"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 2</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 100</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">diskf</span><span class="op">)</span> <span class="co"># 2</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] 2</span>
@@ -158,19 +154,15 @@ <h2>Examples</h2>
 <span class="r-in"><span class="co"># you wish to add multiple chunk in parralel</span></span>
 <span class="r-in"></span>
 <span class="r-in"><span class="fu">add_chunk</span><span class="op">(</span><span class="va">df2</span>, <span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>chunk<span class="op">=</span><span class="fl">1</span><span class="op">)</span>, <span class="fl">1</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5/tmp_add_chunk2"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm/tmp_add_chunk2"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 1</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 1</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 1</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="fu">add_chunk</span><span class="op">(</span><span class="va">df2</span>, <span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>chunk<span class="op">=</span><span class="fl">2</span><span class="op">)</span>, <span class="fl">3</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5/tmp_add_chunk2"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm/tmp_add_chunk2"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 2</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 2</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 1</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">df2</span><span class="op">)</span> <span class="co"># 2</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] 2</span>
diff --git a/docs/reference/as.data.frame.disk.frame.html b/docs/reference/as.data.frame.disk.frame.html
index abfa6194..aea1586c 100644
--- a/docs/reference/as.data.frame.disk.frame.html
+++ b/docs/reference/as.data.frame.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/as.data.table.disk.frame.html b/docs/reference/as.data.table.disk.frame.html
index 7e9ac1e2..1e5146c2 100644
--- a/docs/reference/as.data.table.disk.frame.html
+++ b/docs/reference/as.data.table.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -115,9 +115,6 @@ <h2>Examples</h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va"><a href="https://r-datatable.com" class="external-link">data.table</a></span><span class="op">)</span></span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> </span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Attaching package: 'data.table'</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> The following object is masked from 'package:purrr':</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span>     transpose</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> The following objects are masked from 'package:dplyr':</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> </span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span>     between, first, last</span>
diff --git a/docs/reference/as.disk.frame.html b/docs/reference/as.disk.frame.html
index 10189939..fa22a8ea 100644
--- a/docs/reference/as.disk.frame.html
+++ b/docs/reference/as.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/bind_rows.disk.frame.html b/docs/reference/bind_rows.disk.frame.html
new file mode 100644
index 00000000..3a336451
--- /dev/null
+++ b/docs/reference/bind_rows.disk.frame.html
@@ -0,0 +1,131 @@
+<!DOCTYPE html>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Bind rows — bind_rows.disk.frame • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Bind rows — bind_rows.disk.frame"><meta property="og:description" content="Bind rows"><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
+<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
+<![endif]--></head><body data-spy="scroll" data-target="#toc">
+    
+
+    <div class="container template-reference-topic">
+      <header><div class="navbar navbar-default navbar-fixed-top" role="navigation">
+  <div class="container">
+    <div class="navbar-header">
+      <button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#navbar" aria-expanded="false">
+        <span class="sr-only">Toggle navigation</span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+      </button>
+      <span class="navbar-brand">
+        <a class="navbar-link" href="../index.html">disk.frame</a>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
+      </span>
+    </div>
+
+    <div id="navbar" class="navbar-collapse collapse">
+      <ul class="nav navbar-nav"><li>
+  <a href="../reference/index.html">Reference</a>
+</li>
+<li class="dropdown">
+  <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-expanded="false">
+    Articles
+     
+    <span class="caret"></span>
+  </a>
+  <ul class="dropdown-menu" role="menu"><li>
+      <a href="../articles/01-intro.html">Preface - The birth of `disk.frame`</a>
+    </li>
+    <li>
+      <a href="../articles/02-intro-disk-frame.html">Quick Start: Basic Operations with nycflights13</a>
+    </li>
+    <li>
+      <a href="../articles/03-concepts.html">Key `{disk.frame}` concepts</a>
+    </li>
+    <li>
+      <a href="../articles/04-ingesting-data.html">Ingesting Data</a>
+    </li>
+    <li>
+      <a href="../articles/05-data-table-syntax.html">Using data.table syntax with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/06-vs-dask-juliadb.html">Benchmarks 1: disk.frame beats Dask! disk.frame beats JuliaDB! Anyone else wanna challenge?</a>
+    </li>
+    <li>
+      <a href="../articles/07-glm.html">Generalized Linear Models (GLM) including logistic regression with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/08-more-epic.html">{disk.frame} can be more 'epic'</a>
+    </li>
+    <li>
+      <a href="../articles/09-convenience-features.html">Convenience features</a>
+    </li>
+    <li>
+      <a href="../articles/10-group-by.html">Group-by</a>
+    </li>
+    <li>
+      <a href="../articles/11-custom-group-by.html">Custom One-Stage Group-by functions</a>
+    </li>
+    <li>
+      <a href="../articles/88-trouble-shooting.html">Trouble shooting</a>
+    </li>
+  </ul></li>
+<li>
+  <a href="../news/index.html">Changelog</a>
+</li>
+      </ul><ul class="nav navbar-nav navbar-right"><li>
+  <a href="https://github.com/xiaodaigh/disk.frame/" class="external-link">
+    <span class="fab fa-github fa-lg"></span>
+     
+  </a>
+</li>
+      </ul></div><!--/.nav-collapse -->
+  </div><!--/.container -->
+</div><!--/.navbar -->
+
+      
+
+      </header><div class="row">
+  <div class="col-md-9 contents">
+    <div class="page-header">
+    <h1>Bind rows</h1>
+    <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/bind_rows.r" class="external-link"><code>R/bind_rows.r</code></a></small>
+    <div class="hidden name"><code>bind_rows.disk.frame.Rd</code></div>
+    </div>
+
+    <div class="ref-description">
+    <p>Bind rows</p>
+    </div>
+
+    <div id="ref-usage">
+    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">bind_rows.disk.frame</span><span class="op">(</span><span class="va">...</span><span class="op">)</span></code></pre></div>
+    </div>
+
+    <div id="arguments">
+    <h2>Arguments</h2>
+    <dl><dt>...</dt>
+<dd><p>disk.frame to be row bound</p></dd>
+</dl></div>
+
+  </div>
+  <div class="col-md-3 hidden-xs hidden-sm" id="pkgdown-sidebar">
+    <nav id="toc" data-toggle="toc" class="sticky-top"><h2 data-toc-skip>Contents</h2>
+    </nav></div>
+</div>
+
+
+      <footer><div class="copyright">
+  <p></p><p>Developed by Dai ZJ.</p>
+</div>
+
+<div class="pkgdown">
+  <p></p><p>Site built with <a href="https://pkgdown.r-lib.org/" class="external-link">pkgdown</a> 2.0.2.</p>
+</div>
+
+      </footer></div>
+
+  
+
+
+  
+
+  </body></html>
+
diff --git a/docs/reference/chunk_group_by.html b/docs/reference/chunk_group_by.html
index 3b4f8168..f7bbff69 100644
--- a/docs/reference/chunk_group_by.html
+++ b/docs/reference/chunk_group_by.html
@@ -1,5 +1,19 @@
 <!DOCTYPE html>
-<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Group by within each disk.frame — chunk_summarize • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Group by within each disk.frame — chunk_summarize"><meta property="og:description" content="The disk.frame group by operation perform group WITHIN each chunk. This is
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame &lt;- create_chunk_mapper(dplyr::add_count)
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame &lt;- create_chunk_mapper(dplyr::add_tally) — chunk_summarize • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame &lt;- create_chunk_mapper(dplyr::add_count)
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame &lt;- create_chunk_mapper(dplyr::add_tally) — chunk_summarize"><meta property="og:description" content="The disk.frame group by operation perform group WITHIN each chunk. This is
 often used for performance reasons. If the user wishes to perform group-by,
 they may choose to use the `hard_group_by` function which is expensive as it
 reorganizes the chunks by the shard key."><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
@@ -20,7 +34,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -89,7 +103,14 @@
       </header><div class="row">
   <div class="col-md-9 contents">
     <div class="page-header">
-    <h1>Group by within each disk.frame</h1>
+    <h1>#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame &lt;- create_chunk_mapper(dplyr::add_count)
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame &lt;- create_chunk_mapper(dplyr::add_tally)</h1>
     <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/dplyr_verbs.r" class="external-link"><code>R/dplyr_verbs.r</code></a></small>
     <div class="hidden name"><code>chunk_group_by.Rd</code></div>
     </div>
diff --git a/docs/reference/cmap.html b/docs/reference/cmap.html
index 8d46d751..1a518792 100644
--- a/docs/reference/cmap.html
+++ b/docs/reference/cmap.html
@@ -21,7 +21,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -91,7 +91,7 @@
   <div class="col-md-9 contents">
     <div class="page-header">
     <h1>Apply the same function to all chunks</h1>
-    <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/cmap.r" class="external-link"><code>R/cmap.r</code></a>, <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/map-deprecated.r" class="external-link"><code>R/map-deprecated.r</code></a></small>
+    <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/cmap.r" class="external-link"><code>R/cmap.r</code></a></small>
     <div class="hidden name"><code>cmap.Rd</code></div>
     </div>
 
@@ -107,19 +107,7 @@ <h1>Apply the same function to all chunks</h1>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">cmap</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
 
 <span class="co"># S3 method for disk.frame</span>
-<span class="fu">cmap</span><span class="op">(</span>
-  <span class="va">.x</span>,
-  <span class="va">.f</span>,
-  <span class="va">...</span>,
-  outdir <span class="op">=</span> <span class="cn">NULL</span>,
-  keep <span class="op">=</span> <span class="cn">NULL</span>,
-  chunks <span class="op">=</span> <span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">.x</span><span class="op">)</span>,
-  compress <span class="op">=</span> <span class="fl">50</span>,
-  lazy <span class="op">=</span> <span class="cn">TRUE</span>,
-  overwrite <span class="op">=</span> <span class="cn">FALSE</span>,
-  vars_and_pkgs <span class="op">=</span> <span class="fu">future</span><span class="fu">::</span><span class="fu"><a href="https://future.futureverse.org/reference/getGlobalsAndPackages.html" class="external-link">getGlobalsAndPackages</a></span><span class="op">(</span><span class="va">.f</span>, envir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sys.parent.html" class="external-link">parent.frame</a></span><span class="op">(</span><span class="op">)</span><span class="op">)</span>,
-  .progress <span class="op">=</span> <span class="cn">TRUE</span>
-<span class="op">)</span>
+<span class="fu">cmap</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
 
 <span class="fu">cmap_dfr</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span>, .id <span class="op">=</span> <span class="cn">NULL</span><span class="op">)</span>
 
@@ -134,10 +122,9 @@ <h1>Apply the same function to all chunks</h1>
   <span class="va">.f</span>,
   outdir <span class="op">=</span> <span class="cn">NULL</span>,
   keep <span class="op">=</span> <span class="cn">NULL</span>,
-  chunks <span class="op">=</span> <span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">.x</span><span class="op">)</span>,
-  compress <span class="op">=</span> <span class="fl">50</span>,
   lazy <span class="op">=</span> <span class="cn">TRUE</span>,
   overwrite <span class="op">=</span> <span class="cn">FALSE</span>,
+  compress <span class="op">=</span> <span class="fl">50</span>,
   <span class="va">...</span>
 <span class="op">)</span>
 
@@ -161,34 +148,7 @@ <h1>Apply the same function to all chunks</h1>
 
 <span class="fu">delayed</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
 
-<span class="fu">chunk_lapply</span><span class="op">(</span><span class="va">...</span><span class="op">)</span>
-
-<span class="fu">map</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for disk.frame</span>
-<span class="fu">map</span><span class="op">(</span><span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for default</span>
-<span class="fu">map</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="fu">imap_dfr</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span>, .id <span class="op">=</span> <span class="cn">NULL</span><span class="op">)</span>
-
-<span class="co"># S3 method for disk.frame</span>
-<span class="fu">imap_dfr</span><span class="op">(</span><span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for default</span>
-<span class="fu">imap_dfr</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span>, .id <span class="op">=</span> <span class="cn">NULL</span><span class="op">)</span>
-
-<span class="fu">imap</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for default</span>
-<span class="fu">imap</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for disk.frame</span>
-<span class="fu"><a href="https://purrr.tidyverse.org/reference/map.html" class="external-link">map_dfr</a></span><span class="op">(</span><span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for default</span>
-<span class="fu"><a href="https://purrr.tidyverse.org/reference/map.html" class="external-link">map_dfr</a></span><span class="op">(</span><span class="va">.x</span>, <span class="va">.f</span>, <span class="va">...</span>, .id <span class="op">=</span> <span class="cn">NULL</span><span class="op">)</span></code></pre></div>
+<span class="fu">clapply</span><span class="op">(</span><span class="va">...</span><span class="op">)</span></code></pre></div>
     </div>
 
     <div id="arguments">
@@ -198,31 +158,25 @@ <h2>Arguments</h2>
 <dt>.f</dt>
 <dd><p>a function to apply to each of the chunks</p></dd>
 <dt>...</dt>
-<dd><p>for compatibility with `purrr::map`</p></dd>
-<dt>outdir</dt>
-<dd><p>the output directory</p></dd>
-<dt>keep</dt>
-<dd><p>the columns to keep from the input</p></dd>
-<dt>chunks</dt>
-<dd><p>The number of chunks to output</p></dd>
-<dt>compress</dt>
-<dd><p>0-100 fst compression ratio</p></dd>
-<dt>lazy</dt>
-<dd><p>if TRUE then do this lazily</p></dd>
-<dt>overwrite</dt>
-<dd><p>if TRUE removes any existing chunks in the data</p></dd>
-<dt>vars_and_pkgs</dt>
-<dd><p>variables and packages to send to a background session. This is typically automatically detected</p></dd>
-<dt>.progress</dt>
-<dd><p>A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From furrr</p></dd>
+<dd><p>Passed to `collect` and `write_disk.frame`</p></dd>
 <dt>.id</dt>
-<dd><p>not used</p></dd>
+<dd><p>ignored</p></dd>
 <dt>use.names</dt>
 <dd><p>for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</p></dd>
 <dt>fill</dt>
 <dd><p>for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</p></dd>
 <dt>idcol</dt>
 <dd><p>for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist</p></dd>
+<dt>outdir</dt>
+<dd><p>the output directory</p></dd>
+<dt>keep</dt>
+<dd><p>The columns to keep at source</p></dd>
+<dt>lazy</dt>
+<dd><p>if TRUE then do this lazily</p></dd>
+<dt>overwrite</dt>
+<dd><p>Whether to overwrite any files in the output directory</p></dd>
+<dt>compress</dt>
+<dd><p>The compression setting. 0-100</p></dd>
 </dl></div>
 
     <div id="ref-examples">
@@ -303,30 +257,12 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># return the first row of each chunk eagerly as list</span></span>
 <span class="r-in"><span class="fu">cmap</span><span class="op">(</span><span class="va">cars.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span><span class="fl">1</span>,<span class="op">]</span>, lazy <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[1]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:     4    2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[2]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    11   17</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[3]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    13   46</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[4]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    16   40</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[5]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    19   46</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[6]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    24   70</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file4718220342f7.df"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 6</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 50</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># return the first row of each chunk eagerly as data.table/data.frame by row-binding</span></span>
 <span class="r-in"><span class="fu">cmap_dfr</span><span class="op">(</span><span class="va">cars.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span><span class="fl">1</span>,<span class="op">]</span><span class="op">)</span></span>
@@ -358,137 +294,6 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
 <span class="r-in"><span class="fu"><a href="delete.html">delete</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span></span>
-<span class="r-in"><span class="va">cars.df</span> <span class="op">=</span> <span class="fu"><a href="as.disk.frame.html">as.disk.frame</a></span><span class="op">(</span><span class="va">cars</span><span class="op">)</span></span>
-<span class="r-in"></span>
-<span class="r-in"><span class="co"># .x is the chunk and .y is the ID as an integer</span></span>
-<span class="r-in"></span>
-<span class="r-in"><span class="co"># lazy = TRUE support is not available at the moment</span></span>
-<span class="r-in"><span class="fu">cimap</span><span class="op">(</span><span class="va">cars.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span>, <span class="va">id</span> <span class="op">:=</span> <span class="va">.y</span><span class="op">]</span>, lazy <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[1]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:     4    2  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:     4   10  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:     7    4  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:     7   22  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:     8   16  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6:     9   10  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7:    10   18  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 8:    10   26  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 9:    10   34  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[2]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    11   17  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:    11   28  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:    12   14  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:    12   20  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:    12   24  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6:    12   28  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7:    13   26  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 8:    13   34  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 9:    13   34  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[3]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    13   46  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:    14   26  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:    14   36  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:    14   60  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:    14   80  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6:    15   20  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7:    15   26  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 8:    15   54  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 9:    16   32  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[4]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    16   40  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:    17   32  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:    17   40  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:    17   50  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:    18   42  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6:    18   56  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7:    18   76  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 8:    18   84  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 9:    19   36  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[5]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    19   46  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:    19   68  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:    20   32  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:    20   48  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:    20   52  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6:    20   56  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7:    20   64  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 8:    22   66  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 9:    23   54  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [[6]]</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1:    24   70  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2:    24   92  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3:    24   93  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4:    24  120  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5:    25   85  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> </span>
-<span class="r-in"></span>
-<span class="r-in"><span class="fu">cimap_dfr</span><span class="op">(</span><span class="va">cars.df</span>, <span class="op">~</span><span class="va">.x</span><span class="op">[</span>, <span class="va">id</span> <span class="op">:=</span> <span class="va">.y</span><span class="op">]</span><span class="op">)</span></span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>     speed dist id</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  1:     4    2  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  2:     4   10  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  3:     7    4  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  4:     7   22  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  5:     8   16  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  6:     9   10  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  7:    10   18  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  8:    10   26  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  9:    10   34  1</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 10:    11   17  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 11:    11   28  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 12:    12   14  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 13:    12   20  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 14:    12   24  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 15:    12   28  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 16:    13   26  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 17:    13   34  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 18:    13   34  2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 19:    13   46  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 20:    14   26  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 21:    14   36  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 22:    14   60  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 23:    14   80  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 24:    15   20  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 25:    15   26  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 26:    15   54  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 27:    16   32  3</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 28:    16   40  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 29:    17   32  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 30:    17   40  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 31:    17   50  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 32:    18   42  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 33:    18   56  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 34:    18   76  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 35:    18   84  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 36:    19   36  4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 37:    19   46  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 38:    19   68  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 39:    20   32  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 40:    20   48  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 41:    20   52  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 42:    20   56  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 43:    20   64  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 44:    22   66  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 45:    23   54  5</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 46:    24   70  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 47:    24   92  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 48:    24   93  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 49:    24  120  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 50:    25   85  6</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>     speed dist id</span>
-<span class="r-in"></span>
-<span class="r-in"><span class="co"># clean up cars.df</span></span>
-<span class="r-in"><span class="fu"><a href="delete.html">delete</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span></span>
 </code></pre></div>
     </div>
   </div>
diff --git a/docs/reference/cmap2.html b/docs/reference/cmap2.html
index 0910f609..336c10b5 100644
--- a/docs/reference/cmap2.html
+++ b/docs/reference/cmap2.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -100,8 +100,6 @@ <h1>`cmap2` a function to two disk.frames</h1>
     <div id="ref-usage">
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">cmap2</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.y</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
 
-<span class="fu">map2</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.y</span>, <span class="va">.f</span>, <span class="va">...</span><span class="op">)</span>
-
 <span class="fu">map_by_chunk_id</span><span class="op">(</span><span class="va">.x</span>, <span class="va">.y</span>, <span class="va">.f</span>, <span class="va">...</span>, <span class="va">outdir</span><span class="op">)</span></code></pre></div>
     </div>
 
diff --git a/docs/reference/collect.html b/docs/reference/collect.html
index 5b195078..0d063a49 100644
--- a/docs/reference/collect.html
+++ b/docs/reference/collect.html
@@ -20,7 +20,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -103,12 +103,17 @@ <h1>Bring the disk.frame into R</h1>
 
     <div id="ref-usage">
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="co"># S3 method for disk.frame</span>
-<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">collect</a></span><span class="op">(</span><span class="va">x</span>, <span class="va">...</span>, parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"lazyfn"</span><span class="op">)</span><span class="op">)</span><span class="op">)</span>
+<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">collect</a></span><span class="op">(</span><span class="va">x</span>, <span class="va">...</span>, parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"recordings"</span><span class="op">)</span><span class="op">)</span><span class="op">)</span>
 
-<span class="fu">collect_list</span><span class="op">(</span><span class="va">x</span>, simplify <span class="op">=</span> <span class="cn">FALSE</span>, parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"lazyfn"</span><span class="op">)</span><span class="op">)</span><span class="op">)</span>
+<span class="fu">collect_list</span><span class="op">(</span>
+  <span class="va">x</span>,
+  simplify <span class="op">=</span> <span class="cn">FALSE</span>,
+  parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"recordings"</span><span class="op">)</span><span class="op">)</span>,
+  <span class="va">...</span>
+<span class="op">)</span>
 
 <span class="co"># S3 method for summarized_disk.frame</span>
-<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">collect</a></span><span class="op">(</span><span class="va">x</span>, <span class="va">...</span>, parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"lazyfn"</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></code></pre></div>
+<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">collect</a></span><span class="op">(</span><span class="va">x</span>, <span class="va">...</span>, parallel <span class="op">=</span> <span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">x</span>, <span class="st">"recordings"</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></code></pre></div>
     </div>
 
     <div id="arguments">
diff --git a/docs/reference/colnames.html b/docs/reference/colnames.html
index 3743a499..210eada5 100644
--- a/docs/reference/colnames.html
+++ b/docs/reference/colnames.html
@@ -20,7 +20,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/compute.disk.frame.html b/docs/reference/compute.disk.frame.html
index 8feaf6eb..5e9a9f2c 100644
--- a/docs/reference/compute.disk.frame.html
+++ b/docs/reference/compute.disk.frame.html
@@ -1,5 +1,5 @@
 <!DOCTYPE html>
-<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Compute without writing — compute.disk.frame • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Compute without writing — compute.disk.frame"><meta property="og:description" content="Perform the computation; same as calling cmap without .f and lazy = FALSE"><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Force computations. The results are stored in a folder. — compute.disk.frame • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Force computations. The results are stored in a folder. — compute.disk.frame"><meta property="og:description" content="Perform the computation; same as calling cmap without .f and lazy = FALSE"><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
 <script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
 <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
 <![endif]--></head><body data-spy="scroll" data-target="#toc">
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -86,7 +86,7 @@
       </header><div class="row">
   <div class="col-md-9 contents">
     <div class="page-header">
-    <h1>Compute without writing</h1>
+    <h1>Force computations. The results are stored in a folder.</h1>
     <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/compute.r" class="external-link"><code>R/compute.r</code></a></small>
     <div class="hidden name"><code>compute.disk.frame.Rd</code></div>
     </div>
@@ -97,13 +97,7 @@ <h1>Compute without writing</h1>
 
     <div id="ref-usage">
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="co"># S3 method for disk.frame</span>
-<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">compute</a></span><span class="op">(</span>
-  <span class="va">x</span>,
-  <span class="va">name</span>,
-  outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span><span class="st">"tmp_df_"</span>, fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span>,
-  overwrite <span class="op">=</span> <span class="cn">TRUE</span>,
-  <span class="va">...</span>
-<span class="op">)</span></code></pre></div>
+<span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">compute</a></span><span class="op">(</span><span class="va">x</span>, name <span class="op">=</span> <span class="cn">NULL</span>, outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span><span class="st">"tmp_df_"</span>, fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span>, <span class="va">...</span><span class="op">)</span></code></pre></div>
     </div>
 
     <div id="arguments">
@@ -111,13 +105,11 @@ <h2>Arguments</h2>
     <dl><dt>x</dt>
 <dd><p>a disk.frame</p></dd>
 <dt>name</dt>
-<dd><p>Not used. Kept for compatibility with dplyr</p></dd>
+<dd><p>If not NULL then used as outdir prefix.</p></dd>
 <dt>outdir</dt>
 <dd><p>the output directory</p></dd>
-<dt>overwrite</dt>
-<dd><p>whether to overwrite or not</p></dd>
 <dt>...</dt>
-<dd><p>Not used. Kept for dplyr compatibility</p></dd>
+<dd><p>Passed to `write_disk.frame`</p></dd>
 </dl></div>
 
     <div id="ref-examples">
diff --git a/docs/reference/create_chunk_mapper.html b/docs/reference/create_chunk_mapper.html
index 7c28d311..1269b5dd 100644
--- a/docs/reference/create_chunk_mapper.html
+++ b/docs/reference/create_chunk_mapper.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -96,7 +96,7 @@ <h1>Create function that applies to each chunk if disk.frame</h1>
     </div>
 
     <div id="ref-usage">
-    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">create_chunk_mapper</span><span class="op">(</span><span class="va">chunk_fn</span>, warning_msg <span class="op">=</span> <span class="cn">NULL</span>, as.data.frame <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span></code></pre></div>
+    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">create_chunk_mapper</span><span class="op">(</span><span class="va">chunk_fn</span>, warning_msg <span class="op">=</span> <span class="cn">NULL</span>, as.data.frame <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></code></pre></div>
     </div>
 
     <div id="arguments">
diff --git a/docs/reference/csv_to_disk.frame.html b/docs/reference/csv_to_disk.frame.html
index 17b0d387..f91d899a 100644
--- a/docs/reference/csv_to_disk.frame.html
+++ b/docs/reference/csv_to_disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -142,8 +142,7 @@ <h2>Arguments</h2>
 <dt>header</dt>
 <dd><p>Whether the files have header. Defaults to TRUE</p></dd>
 <dt>.progress</dt>
-<dd><p>A logical, for whether or not to print a progress bar for
-multiprocess, multisession, and multicore plans. From furrr</p></dd>
+<dd><p>A logical, for whether or not to show progress</p></dd>
 <dt>backend</dt>
 <dd><p>The CSV reader backend to choose: "data.table" or "readr". 
 disk.frame does not have its own CSV reader. It uses either
diff --git a/docs/reference/delete.html b/docs/reference/delete.html
index 2a238505..9cf26191 100644
--- a/docs/reference/delete.html
+++ b/docs/reference/delete.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/df_ram_size.html b/docs/reference/df_ram_size.html
index 57bfaa8d..c986617f 100644
--- a/docs/reference/df_ram_size.html
+++ b/docs/reference/df_ram_size.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/dfglm.html b/docs/reference/dfglm.html
index 1197ac98..c9cc7c73 100644
--- a/docs/reference/dfglm.html
+++ b/docs/reference/dfglm.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/disk.frame.html b/docs/reference/disk.frame.html
index 0d2320c2..fd1f9556 100644
--- a/docs/reference/disk.frame.html
+++ b/docs/reference/disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -111,12 +111,10 @@ <h2>Arguments</h2>
     <h2>Examples</h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span class="va">path</span> <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/file.path.html" class="external-link">file.path</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempdir</a></span><span class="op">(</span><span class="op">)</span>,<span class="st">"cars"</span><span class="op">)</span></span>
 <span class="r-in"><span class="fu"><a href="as.disk.frame.html">as.disk.frame</a></span><span class="op">(</span><span class="va">cars</span>, outdir<span class="op">=</span><span class="va">path</span>, overwrite <span class="op">=</span> <span class="cn">TRUE</span>, nchunks <span class="op">=</span> <span class="fl">2</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5/cars"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm/cars"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 2</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 50</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="va">df</span> <span class="op">=</span> <span class="fu">disk.frame</span><span class="op">(</span><span class="va">path</span><span class="op">)</span></span>
 <span class="r-in"><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>    speed dist</span>
diff --git a/docs/reference/dplyr_verbs.html b/docs/reference/dplyr_verbs.html
index 4cbb0612..143e9c7e 100644
--- a/docs/reference/dplyr_verbs.html
+++ b/docs/reference/dplyr_verbs.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -118,11 +118,6 @@ <h1>The dplyr verbs implemented for disk.frame</h1>
 
 <span class="fu">chunk_arrange</span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span><span class="op">)</span>
 
-<span class="fu">add_tally.disk.frame</span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="co"># S3 method for disk.frame</span>
-<span class="fu"><a href="https://dplyr.tidyverse.org/reference/do.html" class="external-link">do</a></span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span><span class="op">)</span>
-
 <span class="co"># S3 method for disk.frame</span>
 <span class="fu"><a href="https://dplyr.tidyverse.org/reference/distinct.html" class="external-link">distinct</a></span><span class="op">(</span><span class="va">...</span><span class="op">)</span>
 
diff --git a/docs/reference/evalparseglue.html b/docs/reference/evalparseglue.html
index 4172714e..d88bc80a 100644
--- a/docs/reference/evalparseglue.html
+++ b/docs/reference/evalparseglue.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/foverlaps.disk.frame.html b/docs/reference/foverlaps.disk.frame.html
index 19607792..6fbc7457 100644
--- a/docs/reference/foverlaps.disk.frame.html
+++ b/docs/reference/foverlaps.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/gen_datatable_synthetic.html b/docs/reference/gen_datatable_synthetic.html
index 608041f6..8855f4c1 100644
--- a/docs/reference/gen_datatable_synthetic.html
+++ b/docs/reference/gen_datatable_synthetic.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/get_chunk.html b/docs/reference/get_chunk.html
index 66df5c10..fffdd1c7 100644
--- a/docs/reference/get_chunk.html
+++ b/docs/reference/get_chunk.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/get_chunk_ids.html b/docs/reference/get_chunk_ids.html
index d54c8f15..fc6d82da 100644
--- a/docs/reference/get_chunk_ids.html
+++ b/docs/reference/get_chunk_ids.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -121,12 +121,12 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># return the file name chunk IDs</span></span>
 <span class="r-in"><span class="fu">get_chunk_ids</span><span class="op">(</span><span class="va">cars.df</span>, full.names <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span></span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/1.fst"</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [2] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/2.fst"</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [3] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/3.fst"</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [4] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/4.fst"</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [5] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/5.fst"</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [6] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\Rtmp2rQjw5\\file56f46178545a.df/6.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [1] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/1.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [2] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/2.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [3] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/3.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [4] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/4.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [5] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/5.fst"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [6] "C:\\Users\\RTX2080\\AppData\\Local\\Temp\\RtmpyknGIm\\file471836dbe43.df/6.fst"</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># return the file name chunk IDs with file extension</span></span>
 <span class="r-in"><span class="fu">get_chunk_ids</span><span class="op">(</span><span class="va">cars.df</span>, strip_extension <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span>
diff --git a/docs/reference/group_by.html b/docs/reference/group_by.html
index a7d39c8e..7149e006 100644
--- a/docs/reference/group_by.html
+++ b/docs/reference/group_by.html
@@ -20,7 +20,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -109,7 +109,12 @@ <h1>A function to parse the summarize function</h1>
 <span class="fu"><a href="https://dplyr.tidyverse.org/reference/summarise.html" class="external-link">summarize</a></span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span><span class="op">)</span>
 
 <span class="co"># S3 method for disk.frame</span>
-<span class="fu"><a href="https://dplyr.tidyverse.org/reference/group_by.html" class="external-link">group_by</a></span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span>, add <span class="op">=</span> <span class="cn">FALSE</span>, .drop <span class="op">=</span> <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/group_by_drop_default.html" class="external-link">group_by_drop_default</a></span><span class="op">(</span><span class="va">.data</span><span class="op">)</span><span class="op">)</span>
+<span class="fu"><a href="https://dplyr.tidyverse.org/reference/group_by.html" class="external-link">group_by</a></span><span class="op">(</span>
+  <span class="va">.data</span>,
+  <span class="va">...</span>,
+  .add <span class="op">=</span> <span class="cn">FALSE</span>,
+  .drop <span class="op">=</span> <span class="kw"><a href="https://rdrr.io/r/base/stop.html" class="external-link">stop</a></span><span class="op">(</span><span class="st">"disk.frame does not support `.drop` in `group_by` at this stage"</span><span class="op">)</span>
+<span class="op">)</span>
 
 <span class="co"># S3 method for disk.frame</span>
 <span class="fu"><a href="https://dplyr.tidyverse.org/reference/summarise.html" class="external-link">summarize</a></span><span class="op">(</span><span class="va">.data</span>, <span class="va">...</span><span class="op">)</span>
@@ -124,7 +129,7 @@ <h2>Arguments</h2>
 <dd><p>a disk.frame</p></dd>
 <dt>...</dt>
 <dd><p>same as the dplyr::group_by</p></dd>
-<dt>add</dt>
+<dt>.add</dt>
 <dd><p>from dplyr</p></dd>
 <dt>.drop</dt>
 <dd><p>from dplyr</p></dd>
diff --git a/docs/reference/groups.disk.frame.html b/docs/reference/groups.disk.frame.html
index 02be8acf..89dc5d99 100644
--- a/docs/reference/groups.disk.frame.html
+++ b/docs/reference/groups.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/head_tail.html b/docs/reference/head_tail.html
index 6312a2b2..01e04939 100644
--- a/docs/reference/head_tail.html
+++ b/docs/reference/head_tail.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/index.html b/docs/reference/index.html
index 482f042c..7447de77 100644
--- a/docs/reference/index.html
+++ b/docs/reference/index.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -109,16 +109,27 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
           <p><code><a href="as.disk.frame.html">as.disk.frame()</a></code> </p>
         </td>
         <td><p>Make a data.frame into a disk.frame</p></td>
+      </tr><tr><td>
+          <p><code><a href="bind_rows.disk.frame.html">bind_rows.disk.frame()</a></code> </p>
+        </td>
+        <td><p>Bind rows</p></td>
       </tr><tr><td>
           <p><code><a href="chunk_group_by.html">chunk_summarize()</a></code> <code><a href="chunk_group_by.html">chunk_summarise()</a></code> <code><a href="chunk_group_by.html">chunk_group_by()</a></code> <code><a href="chunk_group_by.html">chunk_ungroup()</a></code> </p>
         </td>
-        <td><p>Group by within each disk.frame</p></td>
+        <td><p>#' @export
+#' @importFrom dplyr add_count
+#' @rdname dplyr_verbs
+add_count.disk.frame &lt;- create_chunk_mapper(dplyr::add_count)
+#' @export
+#' @importFrom dplyr add_tally
+#' @rdname dplyr_verbs
+add_tally.disk.frame &lt;- create_chunk_mapper(dplyr::add_tally)</p></td>
       </tr><tr><td>
-          <p><code><a href="cmap.html">cmap()</a></code> <code><a href="cmap.html">cmap_dfr()</a></code> <code><a href="cmap.html">cimap()</a></code> <code><a href="cmap.html">cimap_dfr()</a></code> <code><a href="cmap.html">lazy()</a></code> <code><a href="cmap.html">delayed()</a></code> <code><a href="cmap.html">chunk_lapply()</a></code> <code><a href="cmap.html">map()</a></code> <code><a href="cmap.html">imap_dfr()</a></code> <code><a href="cmap.html">imap()</a></code> <code><a href="cmap.html">map_dfr(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="cmap.html">map_dfr(<i>&lt;default&gt;</i>)</a></code> </p>
+          <p><code><a href="cmap.html">cmap()</a></code> <code><a href="cmap.html">cmap_dfr()</a></code> <code><a href="cmap.html">cimap()</a></code> <code><a href="cmap.html">cimap_dfr()</a></code> <code><a href="cmap.html">lazy()</a></code> <code><a href="cmap.html">delayed()</a></code> <code><a href="cmap.html">clapply()</a></code> </p>
         </td>
         <td><p>Apply the same function to all chunks</p></td>
       </tr><tr><td>
-          <p><code><a href="cmap2.html">cmap2()</a></code> <code><a href="cmap2.html">map2()</a></code> <code><a href="cmap2.html">map_by_chunk_id()</a></code> </p>
+          <p><code><a href="cmap2.html">cmap2()</a></code> <code><a href="cmap2.html">map_by_chunk_id()</a></code> </p>
         </td>
         <td><p>`cmap2` a function to two disk.frames</p></td>
       </tr><tr><td>
@@ -132,7 +143,7 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
       </tr><tr><td>
           <p><code><a href="compute.disk.frame.html">compute(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
-        <td><p>Compute without writing</p></td>
+        <td><p>Force computations. The results are stored in a folder.</p></td>
       </tr><tr><td>
           <p><code><a href="create_chunk_mapper.html">create_chunk_mapper()</a></code> </p>
         </td>
@@ -158,7 +169,7 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
         </td>
         <td><p>Create a disk.frame from a folder</p></td>
       </tr><tr><td>
-          <p><code><a href="dplyr_verbs.html">select(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">rename(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">filter(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">mutate(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">transmute(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">arrange(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">chunk_arrange()</a></code> <code><a href="dplyr_verbs.html">add_tally.disk.frame()</a></code> <code><a href="dplyr_verbs.html">do(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">distinct(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">chunk_distinct()</a></code> <code><a href="dplyr_verbs.html">glimpse(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
+          <p><code><a href="dplyr_verbs.html">select(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">rename(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">filter(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">mutate(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">transmute(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">arrange(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">chunk_arrange()</a></code> <code><a href="dplyr_verbs.html">distinct(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="dplyr_verbs.html">chunk_distinct()</a></code> <code><a href="dplyr_verbs.html">glimpse(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
         <td><p>The dplyr verbs implemented for disk.frame</p></td>
       </tr><tr><td>
@@ -189,14 +200,6 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
           <p><code><a href="group_by.html">summarise(<i>&lt;grouped_disk.frame&gt;</i>)</a></code> <code><a href="group_by.html">summarize(<i>&lt;grouped_disk.frame&gt;</i>)</a></code> <code><a href="group_by.html">group_by(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="group_by.html">summarize(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="group_by.html">summarise(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
         <td><p>A function to parse the summarize function</p></td>
-      </tr><tr><td>
-          <p><code><a href="hard_arrange.html">hard_arrange()</a></code> </p>
-        </td>
-        <td><p>Perform a hard arrange</p></td>
-      </tr><tr><td>
-          <p><code><a href="hard_group_by.html">hard_group_by()</a></code> </p>
-        </td>
-        <td><p>Perform a hard group</p></td>
       </tr><tr><td>
           <p><code><a href="head_tail.html">head(<i>&lt;disk.frame&gt;</i>)</a></code> <code><a href="head_tail.html">tail(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
@@ -237,6 +240,10 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
           <p><code><a href="overwrite_check.html">overwrite_check()</a></code> </p>
         </td>
         <td><p>Check if the outdir exists or not</p></td>
+      </tr><tr><td>
+          <p><code><a href="play.html">play()</a></code> </p>
+        </td>
+        <td><p>Play the recorded lazy operations</p></td>
       </tr><tr><td>
           <p><code><a href="print.disk.frame.html">print(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
@@ -245,6 +252,10 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
           <p><code><a href="pull.disk.frame.html">pull(<i>&lt;disk.frame&gt;</i>)</a></code> </p>
         </td>
         <td><p>Pull a column from table similar to `dplyr::pull`.</p></td>
+      </tr><tr><td>
+          <p><code><a href="purrr_as_mapper.html">purrr_as_mapper()</a></code> </p>
+        </td>
+        <td><p>Used to convert a function to purrr syntax if needed</p></td>
       </tr><tr><td>
           <p><code><a href="rbindlist.disk.frame.html">rbindlist.disk.frame()</a></code> </p>
         </td>
@@ -286,7 +297,7 @@ <h2 id="all-functions">All functions <a href="#all-functions" class="anchor" ari
         </td>
         <td><p>Show the code to setup disk.frame</p></td>
       </tr><tr><td>
-          <p><code><a href="srckeep.html">srckeep()</a></code> <code><a href="srckeep.html">srckeepchunks()</a></code> </p>
+          <p><code><a href="srckeep.html">srckeep()</a></code> </p>
         </td>
         <td><p>Keep only the variables from the input listed in selections</p></td>
       </tr><tr><td>
diff --git a/docs/reference/is_disk.frame.html b/docs/reference/is_disk.frame.html
index c56ab38f..d32d0036 100644
--- a/docs/reference/is_disk.frame.html
+++ b/docs/reference/is_disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/join.html b/docs/reference/join.html
index 6bdc7ff7..87b1e852 100644
--- a/docs/reference/join.html
+++ b/docs/reference/join.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -128,7 +128,9 @@ <h1>Performs join/merge for disk.frames</h1>
   <span class="va">y</span>,
   by <span class="op">=</span> <span class="cn">NULL</span>,
   copy <span class="op">=</span> <span class="cn">FALSE</span>,
+  suffix <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">".x"</span>, <span class="st">".y"</span><span class="op">)</span>,
   <span class="va">...</span>,
+  keep <span class="op">=</span> <span class="cn">FALSE</span>,
   outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span><span class="st">"tmp_disk_frame_inner_join"</span><span class="op">)</span>,
   merge_by_chunk_id <span class="op">=</span> <span class="cn">NULL</span>,
   overwrite <span class="op">=</span> <span class="cn">TRUE</span>,
@@ -141,7 +143,9 @@ <h1>Performs join/merge for disk.frames</h1>
   <span class="va">y</span>,
   by <span class="op">=</span> <span class="cn">NULL</span>,
   copy <span class="op">=</span> <span class="cn">FALSE</span>,
+  suffix <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">".x"</span>, <span class="st">".y"</span><span class="op">)</span>,
   <span class="va">...</span>,
+  keep <span class="op">=</span> <span class="cn">FALSE</span>,
   outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span><span class="st">"tmp_disk_frame_left_join"</span><span class="op">)</span>,
   merge_by_chunk_id <span class="op">=</span> <span class="cn">FALSE</span>,
   overwrite <span class="op">=</span> <span class="cn">TRUE</span>,
@@ -182,6 +186,10 @@ <h2>Arguments</h2>
 <dd><p>overwrite output directory</p></dd>
 <dt>.progress</dt>
 <dd><p>Show progress or not. Defaults to FALSE</p></dd>
+<dt>suffix</dt>
+<dd><p>see dplyr::XXX_join</p></dd>
+<dt>keep</dt>
+<dd><p>see dplyr::XXX_join</p></dd>
 </dl></div>
     <div id="value">
     <h2>Value</h2>
@@ -195,12 +203,7 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">anti_joined.df</span> <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter-joins.html" class="external-link">anti_join</a></span><span class="op">(</span><span class="va">df.df</span>, <span class="va">df2.df</span><span class="op">)</span> </span>
 <span class="r-wrn co"><span class="r-pr">#&gt;</span> <span class="warning">Warning: </span>merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">anti_joined.df</span> <span class="op"><a href="https://magrittr.tidyverse.org/reference/pipe.html" class="external-link">%&gt;%</a></span> <span class="va">collect</span></span>
@@ -208,9 +211,6 @@ <h2>Examples</h2>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 1: 3 6</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">anti_joined.data.frame</span> <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter-joins.html" class="external-link">anti_join</a></span><span class="op">(</span><span class="va">df.df</span>, <span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>x <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fl">2</span>, z <span class="op">=</span> <span class="fl">10</span><span class="op">:</span><span class="fl">11</span><span class="op">)</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Joining, by = "x"</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Joining, by = "x"</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Joining, by = "x"</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up</span></span>
 <span class="r-in"><span class="fu"><a href="delete.html">delete</a></span><span class="op">(</span><span class="va">df.df</span><span class="op">)</span></span>
@@ -233,20 +233,8 @@ <h2>Examples</h2>
 <span class="r-in"><span class="va">cars.df</span> <span class="op">=</span> <span class="fu"><a href="as.disk.frame.html">as.disk.frame</a></span><span class="op">(</span><span class="va">cars</span><span class="op">)</span></span>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">join.df</span> <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate-joins.html" class="external-link">left_join</a></span><span class="op">(</span><span class="va">cars.df</span>, <span class="va">cars.df</span><span class="op">)</span></span>
-<span class="r-wrn co"><span class="r-pr">#&gt;</span> <span class="warning">Warning: </span>merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
+<span class="r-wrn co"><span class="r-pr">#&gt;</span> <span class="warning">Warning: </span>`merge_by_chunk_id = FALSE`. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making `y` a data.frame or set merge_by_chunk_id = TRUE for better performance.</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
@@ -256,19 +244,7 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">join.df</span> <span class="op">=</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter-joins.html" class="external-link">semi_join</a></span><span class="op">(</span><span class="va">cars.df</span>, <span class="va">cars.df</span><span class="op">)</span></span>
 <span class="r-wrn co"><span class="r-pr">#&gt;</span> <span class="warning">Warning: </span>merge_by_chunk_id = FALSE. This will take significantly longer and the preparations needed are performed eagerly which may lead to poor performance. Consider making y a data.frame or set merge_by_chunk_id = TRUE for better performance.</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
diff --git a/docs/reference/make_glm_streaming_fn.html b/docs/reference/make_glm_streaming_fn.html
index 91b68bc6..63de7ae6 100644
--- a/docs/reference/make_glm_streaming_fn.html
+++ b/docs/reference/make_glm_streaming_fn.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/merge.disk.frame.html b/docs/reference/merge.disk.frame.html
index 26cafba5..f93a7f53 100644
--- a/docs/reference/merge.disk.frame.html
+++ b/docs/reference/merge.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/move_to.html b/docs/reference/move_to.html
index 9037467e..d4211c0b 100644
--- a/docs/reference/move_to.html
+++ b/docs/reference/move_to.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/nchunks.html b/docs/reference/nchunks.html
index 988619c1..9321954a 100644
--- a/docs/reference/nchunks.html
+++ b/docs/reference/nchunks.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/ncol_nrow.html b/docs/reference/ncol_nrow.html
index a8a9d09a..5b5d239a 100644
--- a/docs/reference/ncol_nrow.html
+++ b/docs/reference/ncol_nrow.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/one-stage-group-by-verbs.html b/docs/reference/one-stage-group-by-verbs.html
index 22b7a93c..ac3c5abf 100644
--- a/docs/reference/one-stage-group-by-verbs.html
+++ b/docs/reference/one-stage-group-by-verbs.html
@@ -19,7 +19,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/overwrite_check.html b/docs/reference/overwrite_check.html
index f4d07be2..a33eaeb4 100644
--- a/docs/reference/overwrite_check.html
+++ b/docs/reference/overwrite_check.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/play.html b/docs/reference/play.html
new file mode 100644
index 00000000..286b1855
--- /dev/null
+++ b/docs/reference/play.html
@@ -0,0 +1,133 @@
+<!DOCTYPE html>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Play the recorded lazy operations — play • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Play the recorded lazy operations — play"><meta property="og:description" content="Play the recorded lazy operations"><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
+<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
+<![endif]--></head><body data-spy="scroll" data-target="#toc">
+    
+
+    <div class="container template-reference-topic">
+      <header><div class="navbar navbar-default navbar-fixed-top" role="navigation">
+  <div class="container">
+    <div class="navbar-header">
+      <button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#navbar" aria-expanded="false">
+        <span class="sr-only">Toggle navigation</span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+      </button>
+      <span class="navbar-brand">
+        <a class="navbar-link" href="../index.html">disk.frame</a>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
+      </span>
+    </div>
+
+    <div id="navbar" class="navbar-collapse collapse">
+      <ul class="nav navbar-nav"><li>
+  <a href="../reference/index.html">Reference</a>
+</li>
+<li class="dropdown">
+  <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-expanded="false">
+    Articles
+     
+    <span class="caret"></span>
+  </a>
+  <ul class="dropdown-menu" role="menu"><li>
+      <a href="../articles/01-intro.html">Preface - The birth of `disk.frame`</a>
+    </li>
+    <li>
+      <a href="../articles/02-intro-disk-frame.html">Quick Start: Basic Operations with nycflights13</a>
+    </li>
+    <li>
+      <a href="../articles/03-concepts.html">Key `{disk.frame}` concepts</a>
+    </li>
+    <li>
+      <a href="../articles/04-ingesting-data.html">Ingesting Data</a>
+    </li>
+    <li>
+      <a href="../articles/05-data-table-syntax.html">Using data.table syntax with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/06-vs-dask-juliadb.html">Benchmarks 1: disk.frame beats Dask! disk.frame beats JuliaDB! Anyone else wanna challenge?</a>
+    </li>
+    <li>
+      <a href="../articles/07-glm.html">Generalized Linear Models (GLM) including logistic regression with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/08-more-epic.html">{disk.frame} can be more 'epic'</a>
+    </li>
+    <li>
+      <a href="../articles/09-convenience-features.html">Convenience features</a>
+    </li>
+    <li>
+      <a href="../articles/10-group-by.html">Group-by</a>
+    </li>
+    <li>
+      <a href="../articles/11-custom-group-by.html">Custom One-Stage Group-by functions</a>
+    </li>
+    <li>
+      <a href="../articles/88-trouble-shooting.html">Trouble shooting</a>
+    </li>
+  </ul></li>
+<li>
+  <a href="../news/index.html">Changelog</a>
+</li>
+      </ul><ul class="nav navbar-nav navbar-right"><li>
+  <a href="https://github.com/xiaodaigh/disk.frame/" class="external-link">
+    <span class="fab fa-github fa-lg"></span>
+     
+  </a>
+</li>
+      </ul></div><!--/.nav-collapse -->
+  </div><!--/.container -->
+</div><!--/.navbar -->
+
+      
+
+      </header><div class="row">
+  <div class="col-md-9 contents">
+    <div class="page-header">
+    <h1>Play the recorded lazy operations</h1>
+    <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/play.r" class="external-link"><code>R/play.r</code></a></small>
+    <div class="hidden name"><code>play.Rd</code></div>
+    </div>
+
+    <div class="ref-description">
+    <p>Play the recorded lazy operations</p>
+    </div>
+
+    <div id="ref-usage">
+    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">play</span><span class="op">(</span><span class="va">dataframe</span>, <span class="va">recordings</span><span class="op">)</span></code></pre></div>
+    </div>
+
+    <div id="arguments">
+    <h2>Arguments</h2>
+    <dl><dt>dataframe</dt>
+<dd><p>A data.frame</p></dd>
+<dt>recordings</dt>
+<dd><p>A recording the expression, globals and packages using create_chunk_mapper</p></dd>
+</dl></div>
+
+  </div>
+  <div class="col-md-3 hidden-xs hidden-sm" id="pkgdown-sidebar">
+    <nav id="toc" data-toggle="toc" class="sticky-top"><h2 data-toc-skip>Contents</h2>
+    </nav></div>
+</div>
+
+
+      <footer><div class="copyright">
+  <p></p><p>Developed by Dai ZJ.</p>
+</div>
+
+<div class="pkgdown">
+  <p></p><p>Site built with <a href="https://pkgdown.r-lib.org/" class="external-link">pkgdown</a> 2.0.2.</p>
+</div>
+
+      </footer></div>
+
+  
+
+
+  
+
+  </body></html>
+
diff --git a/docs/reference/print.disk.frame.html b/docs/reference/print.disk.frame.html
index a0ef8db4..76b587e8 100644
--- a/docs/reference/print.disk.frame.html
+++ b/docs/reference/print.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/pull.disk.frame.html b/docs/reference/pull.disk.frame.html
index ff438239..172cb910 100644
--- a/docs/reference/pull.disk.frame.html
+++ b/docs/reference/pull.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/purrr_as_mapper.html b/docs/reference/purrr_as_mapper.html
new file mode 100644
index 00000000..4e334c11
--- /dev/null
+++ b/docs/reference/purrr_as_mapper.html
@@ -0,0 +1,131 @@
+<!DOCTYPE html>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Used to convert a function to purrr syntax if needed — purrr_as_mapper • disk.frame</title><!-- jquery --><script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.4.1/jquery.min.js" integrity="sha256-CSXorXvZcTkaix6Yvo6HppcZGetbYMGWSFlBw8HfCJo=" crossorigin="anonymous"></script><!-- Bootstrap --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" integrity="sha256-bZLfwXAP04zRMK2BjiO8iu9pf4FbLqX6zitd+tIvLhE=" crossorigin="anonymous"><script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js" integrity="sha256-nuL8/2cJ5NDSSwnKD8VqreErSWHtnEP9E7AySL+1ev4=" crossorigin="anonymous"></script><!-- bootstrap-toc --><link rel="stylesheet" href="../bootstrap-toc.css"><script src="../bootstrap-toc.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous"><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous"><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- pkgdown --><link href="../pkgdown.css" rel="stylesheet"><script src="../pkgdown.js"></script><meta property="og:title" content="Used to convert a function to purrr syntax if needed — purrr_as_mapper"><meta property="og:description" content="Used to convert a function to purrr syntax if needed"><!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
+<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
+<![endif]--></head><body data-spy="scroll" data-target="#toc">
+    
+
+    <div class="container template-reference-topic">
+      <header><div class="navbar navbar-default navbar-fixed-top" role="navigation">
+  <div class="container">
+    <div class="navbar-header">
+      <button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#navbar" aria-expanded="false">
+        <span class="sr-only">Toggle navigation</span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+      </button>
+      <span class="navbar-brand">
+        <a class="navbar-link" href="../index.html">disk.frame</a>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
+      </span>
+    </div>
+
+    <div id="navbar" class="navbar-collapse collapse">
+      <ul class="nav navbar-nav"><li>
+  <a href="../reference/index.html">Reference</a>
+</li>
+<li class="dropdown">
+  <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-expanded="false">
+    Articles
+     
+    <span class="caret"></span>
+  </a>
+  <ul class="dropdown-menu" role="menu"><li>
+      <a href="../articles/01-intro.html">Preface - The birth of `disk.frame`</a>
+    </li>
+    <li>
+      <a href="../articles/02-intro-disk-frame.html">Quick Start: Basic Operations with nycflights13</a>
+    </li>
+    <li>
+      <a href="../articles/03-concepts.html">Key `{disk.frame}` concepts</a>
+    </li>
+    <li>
+      <a href="../articles/04-ingesting-data.html">Ingesting Data</a>
+    </li>
+    <li>
+      <a href="../articles/05-data-table-syntax.html">Using data.table syntax with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/06-vs-dask-juliadb.html">Benchmarks 1: disk.frame beats Dask! disk.frame beats JuliaDB! Anyone else wanna challenge?</a>
+    </li>
+    <li>
+      <a href="../articles/07-glm.html">Generalized Linear Models (GLM) including logistic regression with disk.frame</a>
+    </li>
+    <li>
+      <a href="../articles/08-more-epic.html">{disk.frame} can be more 'epic'</a>
+    </li>
+    <li>
+      <a href="../articles/09-convenience-features.html">Convenience features</a>
+    </li>
+    <li>
+      <a href="../articles/10-group-by.html">Group-by</a>
+    </li>
+    <li>
+      <a href="../articles/11-custom-group-by.html">Custom One-Stage Group-by functions</a>
+    </li>
+    <li>
+      <a href="../articles/88-trouble-shooting.html">Trouble shooting</a>
+    </li>
+  </ul></li>
+<li>
+  <a href="../news/index.html">Changelog</a>
+</li>
+      </ul><ul class="nav navbar-nav navbar-right"><li>
+  <a href="https://github.com/xiaodaigh/disk.frame/" class="external-link">
+    <span class="fab fa-github fa-lg"></span>
+     
+  </a>
+</li>
+      </ul></div><!--/.nav-collapse -->
+  </div><!--/.container -->
+</div><!--/.navbar -->
+
+      
+
+      </header><div class="row">
+  <div class="col-md-9 contents">
+    <div class="page-header">
+    <h1>Used to convert a function to purrr syntax if needed</h1>
+    <small class="dont-index">Source: <a href="https://github.com/xiaodaigh/disk.frame/blob/HEAD/R/util.r" class="external-link"><code>R/util.r</code></a></small>
+    <div class="hidden name"><code>purrr_as_mapper.Rd</code></div>
+    </div>
+
+    <div class="ref-description">
+    <p>Used to convert a function to purrr syntax if needed</p>
+    </div>
+
+    <div id="ref-usage">
+    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">purrr_as_mapper</span><span class="op">(</span><span class="va">.f</span><span class="op">)</span></code></pre></div>
+    </div>
+
+    <div id="arguments">
+    <h2>Arguments</h2>
+    <dl><dt>.f</dt>
+<dd><p>a normal function or purrr syntax function i.e. `~ ...code...`</p></dd>
+</dl></div>
+
+  </div>
+  <div class="col-md-3 hidden-xs hidden-sm" id="pkgdown-sidebar">
+    <nav id="toc" data-toggle="toc" class="sticky-top"><h2 data-toc-skip>Contents</h2>
+    </nav></div>
+</div>
+
+
+      <footer><div class="copyright">
+  <p></p><p>Developed by Dai ZJ.</p>
+</div>
+
+<div class="pkgdown">
+  <p></p><p>Site built with <a href="https://pkgdown.r-lib.org/" class="external-link">pkgdown</a> 2.0.2.</p>
+</div>
+
+      </footer></div>
+
+  
+
+
+  
+
+  </body></html>
+
diff --git a/docs/reference/rbindlist.disk.frame.html b/docs/reference/rbindlist.disk.frame.html
index 081dadec..b50ff95f 100644
--- a/docs/reference/rbindlist.disk.frame.html
+++ b/docs/reference/rbindlist.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -122,7 +122,7 @@ <h2>Arguments</h2>
 <dt>overwrite</dt>
 <dd><p>overwrite the output directory</p></dd>
 <dt>.progress</dt>
-<dd><p>A logical, for whether or not to print a progress bar for multiprocess, multisession, and multicore plans. From furrr</p></dd>
+<dd><p>A logical, for whether or not to show progress.</p></dd>
 </dl></div>
 
     <div id="ref-examples">
diff --git a/docs/reference/rechunk.html b/docs/reference/rechunk.html
index 1ad617e3..b5f2b78c 100644
--- a/docs/reference/rechunk.html
+++ b/docs/reference/rechunk.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -98,13 +98,10 @@ <h1>Increase or decrease the number of chunks in the disk.frame</h1>
     <div id="ref-usage">
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">rechunk</span><span class="op">(</span>
   <span class="va">df</span>,
-  <span class="va">nchunks</span>,
+  nchunks <span class="op">=</span> <span class="fu">disk.frame</span><span class="fu">::</span><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span>,
   outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">df</span>, <span class="st">"path"</span>, exact <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span>,
   shardby <span class="op">=</span> <span class="cn">NULL</span>,
-  overwrite <span class="op">=</span> <span class="cn">TRUE</span>,
-  shardby_function <span class="op">=</span> <span class="st">"hash"</span>,
-  sort_splits <span class="op">=</span> <span class="cn">NULL</span>,
-  desc_vars <span class="op">=</span> <span class="cn">NULL</span>
+  overwrite <span class="op">=</span> <span class="cn">TRUE</span>
 <span class="op">)</span></code></pre></div>
     </div>
 
@@ -120,12 +117,6 @@ <h2>Arguments</h2>
 <dd><p>the shardkeys</p></dd>
 <dt>overwrite</dt>
 <dd><p>overwrite the output directory</p></dd>
-<dt>shardby_function</dt>
-<dd><p>splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</p></dd>
-<dt>sort_splits</dt>
-<dd><p>for the "sort" shardby function, a dataframe with the split values.</p></dd>
-<dt>desc_vars</dt>
-<dd><p>for the "sort" shardby function, the variables to sort descending.</p></dd>
 </dl></div>
 
     <div id="ref-examples">
@@ -135,20 +126,15 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># re-chunking cars.df to 3 chunks, done "in-place" to the same folder as cars.df</span></span>
 <span class="r-in"><span class="fu">rechunk</span><span class="op">(</span><span class="va">cars.df</span>, <span class="fl">3</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> files have been backed up to temporary dir C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\back_up_tmp_dir56f4356b56cb. You can recover there files until you restart your R session</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\file56f4c8a34c9.df"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> files have been backed up to temporary dir C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\back_up_tmp_dir471815f02658. You can recover there files until you restart your R session</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file471862cf5821.df"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 3</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 50</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="va">new_path</span> <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span>fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span></span>
 <span class="r-in"><span class="co"># re-chunking cars.df to 4 chunks, shard by speed, and done "out-of-place" to a new directory</span></span>
 <span class="r-in"><span class="va">cars2.df</span> <span class="op">=</span> <span class="fu">rechunk</span><span class="op">(</span><span class="va">cars.df</span>, <span class="fl">4</span>, outdir<span class="op">=</span><span class="va">new_path</span>, shardby <span class="op">=</span> <span class="st">"speed"</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> Appending disk.frames: </span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
diff --git a/docs/reference/recommend_nchunks.html b/docs/reference/recommend_nchunks.html
index e549d81c..dd1c227b 100644
--- a/docs/reference/recommend_nchunks.html
+++ b/docs/reference/recommend_nchunks.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/remove_chunk.html b/docs/reference/remove_chunk.html
index 974ae319..232f00e1 100644
--- a/docs/reference/remove_chunk.html
+++ b/docs/reference/remove_chunk.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -116,34 +116,28 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># removes 3rd chunk</span></span>
 <span class="r-in"><span class="fu">remove_chunk</span><span class="op">(</span><span class="va">cars.df</span>, <span class="fl">3</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\file56f45e4b14bd.df"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file47184b42308d.df"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 3</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 37</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span> <span class="co"># 3</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] 3</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># removes 4th chunk</span></span>
 <span class="r-in"><span class="fu">remove_chunk</span><span class="op">(</span><span class="va">cars.df</span>, <span class="st">"4.fst"</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\file56f45e4b14bd.df"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file47184b42308d.df"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 2</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 26</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span> <span class="co"># 3</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] 2</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># removes 2nd chunk</span></span>
 <span class="r-in"><span class="fu">remove_chunk</span><span class="op">(</span><span class="va">cars.df</span>, <span class="fu"><a href="https://rdrr.io/r/base/file.path.html" class="external-link">file.path</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/attr.html" class="external-link">attr</a></span><span class="op">(</span><span class="va">cars.df</span>, <span class="st">"path"</span>, exact<span class="op">=</span><span class="cn">TRUE</span><span class="op">)</span>, <span class="st">"2.fst"</span><span class="op">)</span>, full.names <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\file56f45e4b14bd.df"</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> path: "C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file47184b42308d.df"</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nchunks: 1</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (at source): 13</span>
 <span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (at source): 2</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> nrow (post operations): ???</span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> ncol (post operations): ???</span>
 <span class="r-in"><span class="fu"><a href="nchunks.html">nchunks</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span> <span class="co"># 1</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] 1</span>
 <span class="r-in"></span>
diff --git a/docs/reference/sample.html b/docs/reference/sample.html
index 719d4244..056cef09 100644
--- a/docs/reference/sample.html
+++ b/docs/reference/sample.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -127,28 +127,28 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="fu"><a href="https://dplyr.tidyverse.org/reference/compute.html" class="external-link">collect</a></span><span class="op">(</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/sample_n.html" class="external-link">sample_frac</a></span><span class="op">(</span><span class="va">cars.df</span>, <span class="fl">0.5</span><span class="op">)</span><span class="op">)</span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>     speed dist</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  1:     7   22</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  2:     7    4</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  3:     9   10</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  4:    10   26</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  5:    13   34</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  6:    11   17</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  7:    12   20</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  8:    11   28</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span>  9:    14   26</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 10:    14   36</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 11:    15   26</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 12:    14   80</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 13:    18   84</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 14:    18   56</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 15:    18   76</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 16:    17   50</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  1:     7    4</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  2:     4    2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  3:    10   18</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  4:    10   34</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  5:    11   17</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  6:    13   34</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  7:    13   26</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  8:    12   28</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  9:    15   26</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 10:    13   46</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 11:    16   32</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 12:    15   20</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 13:    18   42</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 14:    17   50</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 15:    19   36</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 16:    18   76</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 17:    20   56</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 18:    19   46</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 19:    19   68</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 20:    20   32</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 21:    25   85</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 22:    24   70</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 18:    20   64</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 19:    23   54</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 20:    20   52</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 21:    24   93</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 22:    25   85</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>     speed dist</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
diff --git a/docs/reference/setup_disk.frame.html b/docs/reference/setup_disk.frame.html
index 4b1ee1c7..6d502bac 100644
--- a/docs/reference/setup_disk.frame.html
+++ b/docs/reference/setup_disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/shard.html b/docs/reference/shard.html
index eca41f84..7b598974 100644
--- a/docs/reference/shard.html
+++ b/docs/reference/shard.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -104,10 +104,7 @@ <h1>Shard a data.frame/data.table or disk.frame into chunk and saves it into a d
   outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span>fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span>,
   <span class="va">...</span>,
   nchunks <span class="op">=</span> <span class="fu"><a href="recommend_nchunks.html">recommend_nchunks</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span>,
-  overwrite <span class="op">=</span> <span class="cn">FALSE</span>,
-  shardby_function <span class="op">=</span> <span class="st">"hash"</span>,
-  sort_splits <span class="op">=</span> <span class="cn">NULL</span>,
-  desc_vars <span class="op">=</span> <span class="cn">NULL</span>
+  overwrite <span class="op">=</span> <span class="cn">FALSE</span>
 <span class="op">)</span>
 
 <span class="fu">distribute</span><span class="op">(</span><span class="va">...</span><span class="op">)</span></code></pre></div>
@@ -127,12 +124,6 @@ <h2>Arguments</h2>
 <dd><p>The number of chunks</p></dd>
 <dt>overwrite</dt>
 <dd><p>If TRUE then the chunks are overwritten</p></dd>
-<dt>shardby_function</dt>
-<dd><p>splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks</p></dd>
-<dt>sort_splits</dt>
-<dd><p>If shardby_function is "sort", the split values for sharding</p></dd>
-<dt>desc_vars</dt>
-<dd><p>for the "sort" shardby function, the variables to sort descending.</p></dd>
 </dl></div>
 
     <div id="ref-examples">
@@ -140,7 +131,6 @@ <h2>Examples</h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"></span>
 <span class="r-in"><span class="co"># shard the cars data.frame by speed so that rows with the same speed are in the same chunk</span></span>
 <span class="r-in"><span class="va">iris.df</span> <span class="op">=</span> <span class="fu">shard</span><span class="op">(</span><span class="va">iris</span>, <span class="st">"Species"</span><span class="op">)</span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> Hashing...</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up cars.df</span></span>
 <span class="r-in"><span class="fu"><a href="delete.html">delete</a></span><span class="op">(</span><span class="va">iris.df</span><span class="op">)</span></span>
diff --git a/docs/reference/shardkey.html b/docs/reference/shardkey.html
index eeca73d7..2fce89e2 100644
--- a/docs/reference/shardkey.html
+++ b/docs/reference/shardkey.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/shardkey_equal.html b/docs/reference/shardkey_equal.html
index e51669c5..dbc9bcce 100644
--- a/docs/reference/shardkey_equal.html
+++ b/docs/reference/shardkey_equal.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/show_ceremony.html b/docs/reference/show_ceremony.html
index a4e1badc..d1d69c51 100644
--- a/docs/reference/show_ceremony.html
+++ b/docs/reference/show_ceremony.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/srckeep.html b/docs/reference/srckeep.html
index 934352ba..8bfaee95 100644
--- a/docs/reference/srckeep.html
+++ b/docs/reference/srckeep.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -96,9 +96,7 @@ <h1>Keep only the variables from the input listed in selections</h1>
     </div>
 
     <div id="ref-usage">
-    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">srckeep</span><span class="op">(</span><span class="va">diskf</span>, <span class="va">selections</span>, <span class="va">...</span><span class="op">)</span>
-
-<span class="fu">srckeepchunks</span><span class="op">(</span><span class="va">diskf</span>, <span class="va">chunks</span>, <span class="va">...</span><span class="op">)</span></code></pre></div>
+    <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">srckeep</span><span class="op">(</span><span class="va">diskf</span>, <span class="va">selections</span>, <span class="va">...</span><span class="op">)</span></code></pre></div>
     </div>
 
     <div id="arguments">
@@ -109,8 +107,6 @@ <h2>Arguments</h2>
 <dd><p>The list of variables to keep from the input source</p></dd>
 <dt>...</dt>
 <dd><p>not yet used</p></dd>
-<dt>chunks</dt>
-<dd><p>The chunks to load</p></dd>
 </dl></div>
 
     <div id="ref-examples">
diff --git a/docs/reference/sub-.disk.frame.html b/docs/reference/sub-.disk.frame.html
index b3ecb1b5..3c758a26 100644
--- a/docs/reference/sub-.disk.frame.html
+++ b/docs/reference/sub-.disk.frame.html
@@ -17,7 +17,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -131,7 +131,39 @@ <h2>Examples</h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span class="va">cars.df</span> <span class="op">=</span> <span class="fu"><a href="as.disk.frame.html">as.disk.frame</a></span><span class="op">(</span><span class="va">cars</span><span class="op">)</span></span>
 <span class="r-in"><span class="va">speed_limit</span> <span class="op">=</span> <span class="fl">50</span></span>
 <span class="r-in"><span class="va">cars.df</span><span class="op">[</span><span class="va">speed</span> <span class="op">&lt;</span> <span class="va">speed_limit</span> ,<span class="va">.N</span>, <span class="fu"><a href="https://rdrr.io/r/base/cut.html" class="external-link">cut</a></span><span class="op">(</span><span class="va">dist</span>, <span class="fu"><a href="https://rdrr.io/r/base/pretty.html" class="external-link">pretty</a></span><span class="op">(</span><span class="va">dist</span><span class="op">)</span><span class="op">)</span><span class="op">]</span></span>
-<span class="r-err co"><span class="r-pr">#&gt;</span> <span class="error">Error in .checkTypos(e, names_x):</span> Object 'speed_limit' not found amongst speed, dist</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> data.table syntax for disk.frame may be moved to a separate package in the future</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>           cut N</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  1:     (0,5] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  2:    (5,10] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  3:   (20,25] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  4:   (15,20] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  5:   (25,30] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  6:   (30,35] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  7:   (15,20] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  8:   (25,30] 3</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>  9:   (10,15] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 10:   (20,25] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 11:   (30,35] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 12:   (40,50] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 13:   (20,30] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 14:   (30,40] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 15:   (50,60] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 16:   (70,80] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 17:      &lt;NA&gt; 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 18:   (30,40] 4</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 19:   (40,50] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 20:   (50,60] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 21:   (70,80] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 22:   (80,90] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 23:   (40,50] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 24:   (60,70] 3</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 25:   (30,40] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 26:   (50,60] 3</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 27:      &lt;NA&gt; 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 28:  (90,100] 2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 29: (110,120] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 30:   (80,90] 1</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span>           cut N</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># clean up</span></span>
 <span class="r-in"><span class="fu"><a href="delete.html">delete</a></span><span class="op">(</span><span class="va">cars.df</span><span class="op">)</span></span>
diff --git a/docs/reference/tbl_vars.disk.frame.html b/docs/reference/tbl_vars.disk.frame.html
index d61fa7a6..1df5aeaf 100644
--- a/docs/reference/tbl_vars.disk.frame.html
+++ b/docs/reference/tbl_vars.disk.frame.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
diff --git a/docs/reference/write_disk.frame.html b/docs/reference/write_disk.frame.html
index 5f3f9fdb..6eda846a 100644
--- a/docs/reference/write_disk.frame.html
+++ b/docs/reference/write_disk.frame.html
@@ -18,7 +18,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -99,10 +99,10 @@ <h1>Write disk.frame to disk</h1>
 
     <div id="ref-usage">
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="fu">write_disk.frame</span><span class="op">(</span>
-  <span class="va">df</span>,
+  <span class="va">diskf</span>,
   outdir <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span>fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span>,
-  nchunks <span class="op">=</span> <span class="fu"><a href="https://Rdatatable.gitlab.io/data.table/reference/fifelse.html" class="external-link">ifelse</a></span><span class="op">(</span><span class="st">"disk.frame"</span> <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="fu"><a href="https://rdrr.io/r/base/class.html" class="external-link">class</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span>, <span class="fu"><a href="nchunks.html">nchunks.disk.frame</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span>,
-    <span class="fu"><a href="recommend_nchunks.html">recommend_nchunks</a></span><span class="op">(</span><span class="va">df</span><span class="op">)</span><span class="op">)</span>,
+  nchunks <span class="op">=</span> <span class="fu"><a href="https://Rdatatable.gitlab.io/data.table/reference/fifelse.html" class="external-link">ifelse</a></span><span class="op">(</span><span class="st">"disk.frame"</span> <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="fu"><a href="https://rdrr.io/r/base/class.html" class="external-link">class</a></span><span class="op">(</span><span class="va">diskf</span><span class="op">)</span>, <span class="fu"><a href="nchunks.html">nchunks.disk.frame</a></span><span class="op">(</span><span class="va">diskf</span><span class="op">)</span>,
+    <span class="fu"><a href="recommend_nchunks.html">recommend_nchunks</a></span><span class="op">(</span><span class="va">diskf</span><span class="op">)</span><span class="op">)</span>,
   overwrite <span class="op">=</span> <span class="cn">FALSE</span>,
   shardby <span class="op">=</span> <span class="cn">NULL</span>,
   compress <span class="op">=</span> <span class="fl">50</span>,
@@ -117,7 +117,7 @@ <h1>Write disk.frame to disk</h1>
 
     <div id="arguments">
     <h2>Arguments</h2>
-    <dl><dt>df</dt>
+    <dl><dt>diskf</dt>
 <dd><p>a disk.frame</p></dd>
 <dt>outdir</dt>
 <dd><p>output directory for the disk.frame</p></dd>
diff --git a/docs/reference/zip_to_disk.frame.html b/docs/reference/zip_to_disk.frame.html
index 9188f8ac..fe4335d3 100644
--- a/docs/reference/zip_to_disk.frame.html
+++ b/docs/reference/zip_to_disk.frame.html
@@ -20,7 +20,7 @@
       </button>
       <span class="navbar-brand">
         <a class="navbar-link" href="../index.html">disk.frame</a>
-        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.5.0</span>
+        <span class="version label label-default" data-toggle="tooltip" data-placement="bottom" title="">0.6.0</span>
       </span>
     </div>
 
@@ -144,7 +144,7 @@ <h2>Examples</h2>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># read every file and convert it to a disk.frame</span></span>
 <span class="r-in"><span class="va">zip.df</span> <span class="op">=</span> <span class="fu">zip_to_disk.frame</span><span class="op">(</span><span class="va">zipfile</span>, <span class="fu"><a href="https://rdrr.io/r/base/tempfile.html" class="external-link">tempfile</a></span><span class="op">(</span>fileext <span class="op">=</span> <span class="st">".df"</span><span class="op">)</span><span class="op">)</span></span>
-<span class="r-err co"><span class="r-pr">#&gt;</span> <span class="error">Error in unzip(zipfile, list = TRUE):</span> zip file 'C:\Users\RTX2080\AppData\Local\Temp\Rtmp2rQjw5\file56f44b886b42.zip' cannot be opened</span>
+<span class="r-err co"><span class="r-pr">#&gt;</span> <span class="error">Error in unzip(zipfile, list = TRUE):</span> zip file 'C:\Users\RTX2080\AppData\Local\Temp\RtmpyknGIm\file471855d8254c.zip' cannot be opened</span>
 <span class="r-in"></span>
 <span class="r-in"><span class="co"># there is only one csv file so it return a list of one disk.frame</span></span>
 <span class="r-in"><span class="va">zip.df</span><span class="op">[[</span><span class="fl">1</span><span class="op">]</span><span class="op">]</span></span>
diff --git a/docs/sitemap.xml b/docs/sitemap.xml
index 4aa93c2a..5df92161 100644
--- a/docs/sitemap.xml
+++ b/docs/sitemap.xml
@@ -120,6 +120,9 @@
   <url>
     <loc>/reference/as.disk.frame.html</loc>
   </url>
+  <url>
+    <loc>/reference/bind_rows.disk.frame.html</loc>
+  </url>
   <url>
     <loc>/reference/bloomfilter.html</loc>
   </url>
@@ -237,12 +240,18 @@
   <url>
     <loc>/reference/overwrite_check.html</loc>
   </url>
+  <url>
+    <loc>/reference/play.html</loc>
+  </url>
   <url>
     <loc>/reference/print.disk.frame.html</loc>
   </url>
   <url>
     <loc>/reference/pull.disk.frame.html</loc>
   </url>
+  <url>
+    <loc>/reference/purrr_as_mapper.html</loc>
+  </url>
   <url>
     <loc>/reference/rbindlist.disk.frame.html</loc>
   </url>
diff --git a/man/bind_rows.disk.frame.Rd b/man/bind_rows.disk.frame.Rd
index 0457d70f..d69a64b0 100644
--- a/man/bind_rows.disk.frame.Rd
+++ b/man/bind_rows.disk.frame.Rd
@@ -7,7 +7,7 @@
 bind_rows.disk.frame(...)
 }
 \arguments{
-\item{...}{}
+\item{...}{disk.frame to be row bound}
 }
 \description{
 Bind rows
diff --git a/man/cmap.Rd b/man/cmap.Rd
index 4189ce18..1f08ba63 100644
--- a/man/cmap.Rd
+++ b/man/cmap.Rd
@@ -30,10 +30,9 @@ cimap(.x, .f, ...)
   .f,
   outdir = NULL,
   keep = NULL,
-  chunks = nchunks(.x),
-  compress = 50,
   lazy = TRUE,
   overwrite = FALSE,
+  compress = 50,
   ...
 )
 
@@ -64,6 +63,8 @@ clapply(...)
 
 \item{...}{Passed to `collect` and `write_disk.frame`}
 
+\item{.id}{ignored}
+
 \item{use.names}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
 
 \item{fill}{for cmap_dfr's call to data.table::rbindlist. See data.table::rbindlist}
@@ -72,7 +73,13 @@ clapply(...)
 
 \item{outdir}{the output directory}
 
+\item{keep}{The columns to keep at source}
+
 \item{lazy}{if TRUE then do this lazily}
+
+\item{overwrite}{Whether to overwrite any files in the output directory}
+
+\item{compress}{The compression setting. 0-100}
 }
 \description{
 Apply the same function to all chunks
diff --git a/man/join.Rd b/man/join.Rd
index 1ea3d3e1..218bd626 100644
--- a/man/join.Rd
+++ b/man/join.Rd
@@ -91,6 +91,10 @@
 \item{overwrite}{overwrite output directory}
 
 \item{.progress}{Show progress or not. Defaults to FALSE}
+
+\item{suffix}{see dplyr::XXX_join}
+
+\item{keep}{see dplyr::XXX_join}
 }
 \value{
 disk.frame or data.frame/data.table
diff --git a/man/rechunk.Rd b/man/rechunk.Rd
index fa42e2eb..086c53b0 100644
--- a/man/rechunk.Rd
+++ b/man/rechunk.Rd
@@ -22,12 +22,6 @@ rechunk(
 \item{shardby}{the shardkeys}
 
 \item{overwrite}{overwrite the output directory}
-
-\item{shardby_function}{splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks}
-
-\item{sort_splits}{for the "sort" shardby function, a dataframe with the split values.}
-
-\item{desc_vars}{for the "sort" shardby function, the variables to sort descending.}
 }
 \description{
 Increase or decrease the number of chunks in the disk.frame
diff --git a/man/shard.Rd b/man/shard.Rd
index 1a9ff5e7..a5250d70 100644
--- a/man/shard.Rd
+++ b/man/shard.Rd
@@ -28,12 +28,6 @@ distribute(...)
 \item{nchunks}{The number of chunks}
 
 \item{overwrite}{If TRUE then the chunks are overwritten}
-
-\item{shardby_function}{splitting of chunks: "hash" for hash function or "sort" for semi-sorted chunks}
-
-\item{sort_splits}{If shardby_function is "sort", the split values for sharding}
-
-\item{desc_vars}{for the "sort" shardby function, the variables to sort descending.}
 }
 \description{
 Shard a data.frame/data.table or disk.frame into chunk and saves it into a disk.frame

From 4f0f5815fbf83b02f5cd9620d848e506115af7ba Mon Sep 17 00:00:00 2001
From: ZJ Dai <zhuojia.dai@gmail.com>
Date: Mon, 31 Jan 2022 00:59:17 +1100
Subject: [PATCH 9/9] minor ignore in rbuild

---
 .Rbuildignore | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/.Rbuildignore b/.Rbuildignore
index de0faa12..5d380324 100644
--- a/.Rbuildignore
+++ b/.Rbuildignore
@@ -68,4 +68,5 @@ vignettes.Rnw.template
 new-nse-dev.r
 test-poorman.R
 .parquet$
-maditr-devs.r
\ No newline at end of file
+maditr-devs.r
+^CRAN-SUBMISSION$