diff --git a/AUTHORS.md b/AUTHORS.md
index f2ddb3f..76d13fb 100644
--- a/AUTHORS.md
+++ b/AUTHORS.md
@@ -24,5 +24,5 @@ Erik Schmidt, and Chris Barnes provided direction to the development effort.
 
 Radha Kandula, Mohan Das Katragadda, Ruchi Desai, Yang Li, Kumar Sadhu,
 Alex Loiacono, Erik Schmidt, Nicholas Rejack, Philip Chase, Roy Keyes,
-and Andrei Sura provided code to make this project awesome.
+Andrei Sura, and Taeber Rapczak provided code to make this project awesome.
 We are nothing without our developers.
diff --git a/CHANGELOG b/CHANGELOG
index 989837f..47f77ce 100644
--- a/CHANGELOG
+++ b/CHANGELOG
@@ -1,3 +1,79 @@
+2014-11-20 v0.13.0
+
+The focus of this release has been clean up. Related functions were moved into
+their own files for easier maintenance and comprehension. Reports were enhanced
+and bugs related to them were fixed. Throttling and uploading were both
+re-examined and new algorithms implemented which, during testing, run-times
+decreased anywhere between 12 and 57%.
+
+ * Add new REDCap Rate Limit throttling algorithm
+ * Improve speed of marking events as sent
+ * Add script that generates enrollment records
+ * Rename "bin" to "redi"
+ * Write report.html to data directory instead of current directory
+ * Write report.xml to data directory instead of configuration directory
+ * Added helper class `bin/utils/rawxml.py` to store information about the
+   input file (can add more info if needed)
+ * Extract report creation and sending from _run()
+ * Add more useful aliases for vagrant box
+ * Updated documentation
+ * Enhanced report
+ * Add the `report.html` as attachment
+
+2014-10-07 v0.12.0
+
+* Summary: Converted documentation to .rst format, enable key-based access to SFTP servers to fetch data, enable installation via fetching from the PyPI repository.
+
+ * remove parse_args() function (Radha Kandula)
+ * Add docopt to redi (Radha Kandula)
+ * Small fix for the README links (Andrei Sura)
+ * Use the `cts-it-red@ctsi.ufl.edu` email for consistency with `setup.py` (Andrei Sura)
+ * Document installation from binaries: `pip install redi-py` (Andrei Sura)
+ * Restore the short README.md because it is referenced by `setup.py` (Andrei Sura)
+ * Remove unused `doc` folder All `*.rst` files are in now in the `docs` folder (Andrei Sura)
+ * Move `doc/flowcharts` to `docs/flowcharts` (Andrei Sura)
+ * Fix links in `README.rst` (Andrei Sura)
+ * Replace `README.md` by a shorter `README.rst` because we have the full content in `docs/about.rst` (Andrei Sura)
+ * Add `help` tasks in the the main `Makefile` (Andrei Sura)
+ * Fix some misspellings of REDCap (Taeber Rapczak)
+ * Fix configuration files to allow uploadig to the pypi.python.org repo @see https://pypi.python.org/pypi/redi-py/0.11.3 (Andrei Sura)
+ * Fix broken documentation links during conversion to `*.rst` (Andrei Sura)
+ * Remove files `setup.rst and test.rst` from `docs/api` to avoid unnecessary document creation (Andrei Sura)
+ * added default emr password of None (Nicholas Rejack)
+ * removed emr sftp server password from required parameters (Nicholas Rejack)
+ * removed author name (Radha Kandula)
+ * Make `GetEmrData.py` immune to `string` passed as port number (Andrei Sura)
+ * Add `requirements.txt` file for RTD (Andrei Sura)
+ * Use default theme in `docs/conf.py` (Andrei Sura)
+ * Edit one method doc to verify if sphinx can pick it (Andrei Sura)
+ * Save important files for docs `sphix-ification` (Andrei Sura)
+ * Save converted files from `doc/*.md` to `docs/*.rst` (Andrei Sura)
+ * Copy images from `doc/images` to `docs/images` for the ReST migration (Andrei Sura)
+ * implemented review comments for pull request #84 (Radha Kandula)
+ * Add contact info to `README.md` (Andrei Sura)
+ * Update AUTHORS.md (Andrei Sura)
+ * Expand documentation about `Installation Steps Using Source Code` + Add short section `How to Use RED-I` (Andrei Sura)
+ * One line documentation fix for deprecated `--keep=yes` (Andrei Sura)
+ * Reformat `describing_a_redcap_form_to_red-i.md` for shorter lines + Moved `screenshot-field-name-lookup.png` to the `images` folder (Andrei Sura)
+ * add fields() function to Event class to get all the fields of it (Radha Kandula)
+ * Rules for clearing values using keyword 'cancel' (Radha Kandula)
+ * Fix anchors for document sections in README.md (Andrei Sura)
+ * Link to Philip's RED-I presentation from the main README.md (Andrei Sura)
+ * Link to our code review guidelines `doc/code-review-checklist.md` from the main README.md (Andrei Sura)
+ * Add the removed pieces from README.md as seprate files in the `doc/` folder (Andrei Sura)
+ * Add more links to existing files in the `doc/` folder from README.md (Andrei Sura)
+ * Add support for --record parameter in redcap_records.py (Philip Chase)
+ * Fix issue with download file name when connecting to sftp (Andrei Sura)
+ * Remove developer specific details from main README.md (Andrei Sura)
+ * Add dependency on `sftpserver` to `.travis.yml` (Andrei Sura)
+ * Add unit test for connecting to sftp with a private key (Andrei Sura)
+ * Use new `sfpt_server_*` params when connecting to sftp with a private key (Andrei Sura)
+ * Use `EmrFileAccessDetails` object for passing new sftp params: * sftp_server_port * sftp_server_private_key * sftp_server_private_key_pass (Andrei Sura)
+ * Correct names for two tasks in `vagrant/Makefile` (Andrei Sura)
+ * Improve documentation in `config-example/settings.ini` Closes issue #63 (Andrei Sura)
+ * Remove unused script: `exportForms.sh` (Andrei Sura)
+ * Use boolean args `keep` and `emrdata` Closes issue #53 with dedicated unit test class `TestArgs` (Andrei Sura)
+
 2014-09-23 v0.11.3
 
  * Summary: Update config-example to work with new sample project
diff --git a/MANIFEST.in b/MANIFEST.in
index 2f2c12b..885a55c 100644
--- a/MANIFEST.in
+++ b/MANIFEST.in
@@ -3,7 +3,7 @@ include LICENSE.txt
 include AUTHORS.md
 include README.md
 include setup.py
-recursive-include bin *.py
+recursive-include redi *.py
 recursive-include test *.py
-recursive-include doc *
+recursive-include docs *
 
diff --git a/Makefile b/Makefile
index 6b8509f..fc016a2 100644
--- a/Makefile
+++ b/Makefile
@@ -23,17 +23,17 @@ help:
 
 test: tests
 tests: coverage
-	[ ! -d config/rules ] || PYTHONPATH=bin \
-		python -munittest discover config/rules
+	[ ! -d config/rules ] || python -munittest discover config/rules
+	rm -f .coverage
+	rm -rf cover/
+	rm -f coverage.xml nosetests.xml
 
 coverage:
-	ARCHFLAGS=$(ARCHFLAGS) PYTHONPATH=bin \
-		python setup.py nosetests
+	ARCHFLAGS=$(ARCHFLAGS) python setup.py nosetests
 
 lint:
 	which pylint || sudo easy_install pylint
-	ARCHFLAGS=$(ARCHFLAGS) PYTHONPATH=bin \
-		pylint -f parseable bin | tee pylint.out
+	ARCHFLAGS=$(ARCHFLAGS) pylint -f parseable redi | tee pylint.out
 
 clean:
 	find . -type f -name "*.pyc" -print | xargs rm -f
@@ -59,6 +59,7 @@ clean:
 	rm -f person_form_event_tree_with_data.xml
 	rm -rf vagrant/data/
 	rm -f vagrant/redi.db
+	rm -f config-example/report.xml
 
 pypi:
 	#https://pythonhosted.org/Distutils2/distutils/packageindex.html
diff --git a/README.md b/README.md
index 03bfc0e..750c019 100644
--- a/README.md
+++ b/README.md
@@ -1,7 +1,7 @@
 RED-I Project
 =============
 
-![DOI](https://zenodo.org/badge/doi/10.5281/zenodo.10014.png ".")
+[![DOI](https://zenodo.org/badge/doi/10.5281/zenodo.10014.png ".")](http://dx.doi.org/10.5281/zenodo.10014)
 
 Introduction
 ------------
diff --git a/bin/redi_lib.py b/bin/redi_lib.py
deleted file mode 100644
index 816d19a..0000000
--- a/bin/redi_lib.py
+++ /dev/null
@@ -1,686 +0,0 @@
-"""
-redi_lib.py
-
-    Stores a collection of utility functions used by redi.py
-"""
-
-__author__ = "University of Florida CTS-IT Team"
-__copyright__ = "Copyright 2014, University of Florida"
-__license__ = "BSD 2-Clause"
-
-import datetime
-import os
-import stat
-import time
-import ast
-from redcap import RedcapError
-import tempfile
-import sqlite3 as lite
-from datetime import date
-import hashlib
-import utils.redi_email as redi_email
-from utils.redcapClient import RedcapClient
-from requests import RequestException
-from lxml import etree
-import logging
-import sys
-logger = logging.getLogger(__name__)
-logger.addHandler(logging.NullHandler())
-
-DEFAULT_DATA_DIRECTORY = os.getcwd()
-
-
-
-"""
-create_import_data_json:
-This function converts data in event tree into json format.
-Parameters:
-    import_data_dict: This parameter holds the event tree data
-    event_tree: This parameter holds the event tree data
-
-@see #generate_output()
-"""
-
-
-def create_import_data_json(
-        import_data_dict,
-        event_tree):
-
-    root = event_tree
-
-    event_name = root.find('name')
-    if event_name is None or not event_name.text:
-        raise Exception('Expected non-blank element event/name')
-
-    import_data_dict['redcap_event_name'] = event_name.text
-
-    event_field_value_list = root.xpath('//event/field/name')
-
-    for name in event_field_value_list:
-        if name.text is None:
-            raise Exception(
-                'Expected non-blank element event/field/name')
-
-    # Match all fields to build a row for each
-    event_field_list = root.xpath('field')
-    contains_data = False
-
-    for field in event_field_list:
-        val = get_child_text_safely(field, 'value')
-        import_data_dict[field.findtext('name')] = val
-
-        if val and not contains_data:
-            contains_data = True
-
-    return {'json_data': import_data_dict, 'contains_data': contains_data}
-
-"""
-Convenience function
-@see create_eav_output
-"""
-
-
-def get_child_text_safely(etree, ele):
-    ele = etree.find(ele)
-    if ele.text is None:
-        return ''
-    else:
-        return ele.text
-
-"""
-Note: This function communicates with the redcap application.
-Steps:
-    - loop for each person/form/event element
-    - generate a csv fragment `using create_eav_output`
-    - send csv fragment to REDCap using `send_eav_data_to_redcap`
-
-
-@return the report_data dictionary
-"""
-
-
-def generate_output(person_tree, redcap_client, rate_limit, data_repository, skip_blanks=False):
-
-    # the global dictionary to be returned
-    report_data = {
-        'errors': []
-    }
-
-    """
-     For each person we keep a count for each form type:
-        subject_details = array(
-            'person_A' => array('form_1': 1, 'form_2': 10, ...
-            'person_B' => array('form_1': 1, 'form_2': 10, ...
-            ...
-        )
-    """
-    subject_details = {}
-
-    # For each form type we keep a global count
-    form_details = {}
-
-    # count how many `person` elements are parsed
-    person_count = 0
-
-    root = person_tree.getroot()
-    persons = root.xpath('//person')
-
-    rate_limiter_value_in_redcap = float(rate_limit)
-
-
-    ideal_time_per_request = 60 / float(rate_limiter_value_in_redcap)
-    time_stamp_after_request = 0
-
-    # main loop for each person
-    for person in persons:
-        time_begin = datetime.datetime.now()
-        person_count += 1
-        study_id = (person.xpath('study_id') or [None])[0]
-
-        if study_id is None:
-            raise Exception('Expected a valid value for study_id')
-
-        # count how many csv fragments are created per person
-        event_count = 0
-        logger.info('Start sending data for study_id: %s' % study_id.text)
-
-        forms = person.xpath('./all_form_events/form')
-
-        # loop through the forms of one person
-        for form in forms:
-            form_name = form.xpath('name')[0].text
-            form_key = 'Total_' + form_name + '_Forms'
-            study_id_key = study_id.text
-
-            # init dictionary for a new person in (study_id)
-            if study_id_key not in subject_details:
-                subject_details[study_id_key] = {}
-
-            if not form_key in subject_details[study_id_key]:
-                subject_details[study_id_key][form_key] = 0
-
-            if form_key not in form_details:
-                form_details[form_key] = 0
-
-            logger.debug(
-                'parsing study_id ' +
-                study_id.text +
-                ' form: ' +
-                form_name)
-
-            # loop through the events of one form
-            for event in form.xpath('event'):
-                event_status = event.findtext('status')
-                if event_status == 'sent':
-                    continue
-                event_count += 1
-
-                try:
-                    import_dict = {
-                        redcap_client.project.def_field: study_id.text}
-                    import_dict = create_import_data_json(
-                        import_dict,
-                        event)
-                    json_data_dict = import_dict['json_data']
-                    contains_data = import_dict['contains_data']
-
-                    # If we're skipping blanks and this event is blank, we
-                    # assume all following events are blank; therefore, break
-                    # out of this for-loop and move on to the next form.
-                    if skip_blanks and not contains_data:
-                        break
-
-                    time_lapse_since_last_request = time.time(
-                    ) - time_stamp_after_request
-                    sleepTime = max(
-                        ideal_time_per_request -
-                        time_lapse_since_last_request,
-                        0)
-                    # print 'Sleep for: %s seconds' % sleepTime
-                    time.sleep(sleepTime)
-
-                    if (0 == event_count % 50):
-                        logger.info('Requests sent: %s' % (event_count))
-
-                    # to speedup testing uncomment the following line
-                    # if (0 == event_count % 2) : continue
-
-                    try:
-                        found_error = False
-                        response = redcap_client.send_data_to_redcap([json_data_dict], overwrite = True)
-                        status = event.find('status')
-                        if status is not None:
-                            status.text = 'sent'
-                        else:
-                            status_element = etree.Element("status")
-                            status_element.text = 'sent'
-                            event.append(status_element)
-                        data_repository.store(person_tree)
-                    except RedcapError as e:
-                        found_error = handle_errors_in_redcap_xml_response(
-                            e.message,
-                            report_data)
-
-                    time_stamp_after_request = time.time()
-
-                    if contains_data:
-                        if not found_error:
-                            # if no errors encountered update event counters
-                            subject_details[study_id_key][form_key] += 1
-                            form_details[form_key] += 1
-
-                except Exception as e:
-                    logger.error(e.message)
-                    raise
-
-        time_end = datetime.datetime.now()
-        logger.info("Total execution time for study_id %s was %s" % (study_id_key, (time_end - time_begin)))
-        logger.info("Total REDCap requests sent: %s \n" % (event_count))
-
-    report_data.update({
-        'total_subjects': person_count,
-        'form_details': form_details,
-        'subject_details': subject_details,
-        'errors': report_data['errors']
-    })
-
-    logger.debug('report_data ' + repr(report_data))
-    return report_data
-
-"""
-handle_errors_in_redcap_xml_response:
-This function checks for any errors in the redcap response and update report data if there are any errors.
-Parameters:
-    redcap_response_xml: This parameter holds the redcap response passed to this function
-    report_data: This parameter holds the report data passed to this function
-
-"""
-
-
-def handle_errors_in_redcap_xml_response(redcap_response, report_data):
-    # converting string to dictionary
-    response = ast.literal_eval(str(redcap_response))
-    logger.debug('handling response from the REDCap')
-    try:
-        if 'error' in response:
-            for recordData in response['records']:
-                error_string = "Error writing to record " + recordData["record"] + " field " + recordData[
-                    "field_name"] + " Value " + recordData["value"] + ".Error Message: " + recordData["message"]
-                logger.info(error_string)
-                report_data['errors'].append(error_string)
-        else:
-            logger.error("REDCap response is in unknown format")
-    except KeyError as e:
-        logger.error(str(e))
-    return True
-
-
-# Convenience method for getting the first element
-# Note: for printing an object can use: print  repr(obj)
-def get_first_item(aList):
-    if aList:
-        return aList[0]
-    return None
-
-"""
-create_temp_dir_debug:
-Creates a folder name with the following format:
-    ./out/out_YYYY_mm_dd:00:11:22
-"""
-
-
-def create_temp_dir_debug(existing_folder=(DEFAULT_DATA_DIRECTORY + 'out')):
-    if not os.path.exists(existing_folder):
-        try:
-            os.makedirs(existing_folder)
-        except:
-            logger.exception(
-                "Folder cannot be created at the path " +
-                existing_folder)
-            raise
-    prefix = 'out_' + datetime.datetime.now().strftime('%Y_%m_%d-%H_%M_%S')
-    mydir = existing_folder + '/' + prefix
-    os.mkdir(mydir)
-    return mydir
-
-"""
-get_temp_path:
-This function returns a folder path.
-If user enters yes along with the optional command line argument -k, then a folder will be created under project root having a timestamp for its name. The files stored under this folder will not be destroyed.
-If user does not use the -k switch then a temporary folder is created at a random location. After the execution of the program, this folder is destroyed.
-"""
-
-
-def get_temp_path(do_keep_gen_files):
-    if do_keep_gen_files:
-        return create_temp_dir_debug() + '/'
-    else:
-        return tempfile.mkdtemp('/')
-
-"""
-delete_temporary_folder:
-deletes the temporary folder specified as argument along with its contents.
-"""
-
-
-def delete_temporary_folder(tmp_folder):
-    fileList = os.listdir(tmp_folder)
-    for fileName in fileList:
-        os.remove(tmp_folder + "/" + fileName)
-    try:
-        os.rmdir(tmp_folder)
-    except OSError:
-        logger.exception(
-            "Folder " +
-            tmp_folder +
-            "is not empty, hence cannot be deleted.")
-        raise
-
-"""
-@see #check_input_file()
-
-The first time we run the app there is no SQLite file
-where to store the md5 sums of the input file.
-This function creates an empty RediBatch in the SQLite
-file specified as `db_path`
-
-@return True if the database file was properly created with an empty table
-"""
-
-def create_empty_md5_database(db_path) :
-    if os.path.exists(db_path) :
-        logger.warn('The file with name ' + db_path + ' already exists')
-        #return
-
-    try :
-        logger.info('Opening the file:' + db_path)
-        fresh_file = open(db_path, 'w')
-        fresh_file.close()
-        os.chmod(db_path, stat.S_IRUSR | stat.S_IWUSR)
-        time.sleep(5)
-
-    except IOError as e:
-        logger.error("I/O error: " + e.strerror + ' for file: ' + db_path)
-        return False
-    success = create_empty_table(db_path)
-    return success
-
-"""
-Helper for #create_empty_md5_database()
-"""
-
-def create_empty_table(db_path) :
-    logger.info('exec create_empty_table')
-    db = None
-    try:
-        db = lite.connect(db_path)
-        cur = db.cursor()
-        sql = """CREATE TABLE RediBatch (
-    rbID INTEGER PRIMARY KEY AUTOINCREMENT,
-    rbStartTime TEXT NOT NULL,
-    rbEndTime TEXT,
-    rbStatus TEXT,
-    rbMd5Sum TEXT NOT NULL
-)
-        """
-        cur.execute(sql)
-
-    except lite.Error as e:
-        logger.error("SQLite error in create_empty_table(): " + e.args[0])
-        return False
-    finally:
-        if db:
-            db.close()
-    logger.info('success create_empty_table')
-    return True
-
-
-"""
-Use this function to set the `row_factory`
-attribute of the database connection
-"""
-
-
-def dict_factory(cursor, row):
-    d = {}
-    for idx, col in enumerate(cursor.description):
-        d[col[0]] = row[idx]
-    return d
-
-"""
-@see bin/redi.py#main()
-@return a dictionary representation of the batch row for the current run
-
-Check the md5sum of the input file
-    - if the sum *has changed* then continue the data processing and store a row
-        in the SQLite database with `batch status= batch_started/ batch_completed`
-
-    - if the sum *did not change* then check the config option `batch_warning_days`:
-        - if       limit = -1       then continue execution (ignore the limit)
-        - if days_passed > limit    then stop the process and email the `redi_admin`
-
-"""
-
-
-def check_input_file(batch_warning_days, db_path, email_settings, raw_xml_file):
-    batch = None
-
-    if not os.path.exists(db_path) :
-        create_empty_md5_database(db_path)
-
-    new_md5ive = get_md5_input_file(raw_xml_file)
-    new_msg = 'Using SQLite file: %s to store input file: %s md5 sum: %s' % (
-        db_path, raw_xml_file, new_md5ive)
-    logger.info(new_msg)
-
-    old_batch = get_last_batch(db_path)
-    old_md5ive = None
-    if old_batch:
-        old_md5ive = old_batch['rbMd5Sum']
-        logger.info('Old md5 sum for the input file is: ' + old_md5ive)
-    else:
-        # this is the first time the checksum feature is used
-        logger.info(
-            "There is no old md5 recorded yet for the input file. Continue data import...")
-        batch = add_batch_entry(db_path, new_md5ive)
-        record_msg = 'Added batch (rbID= %s, rbStartTime= %s, rbMd5Sum= %s' % (
-            batch['rbID'], batch['rbStartTime'], batch['rbMd5Sum'])
-        logger.info(record_msg)
-        return batch
-
-    if old_md5ive != new_md5ive:
-        # the data has changed... insert a new batch entry
-        batch = add_batch_entry(db_path, new_md5ive)
-        record_msg = 'Added batch (rbID= %s, rbStartTime= %s, rbMd5Sum= %s' % (
-            batch['rbID'], batch['rbStartTime'], batch['rbMd5Sum'])
-        logger.info(record_msg)
-        return batch
-    else:
-        days_since_today = get_days_since_today(old_batch['rbStartTime'])
-        # TODO: refactor code to use ConfigParser.RawConfigParser in order to
-        # preserve data types
-
-        if (days_since_today > int(batch_warning_days)):
-            logger.info('Last import was started on: %s which is more than the limit of %s' % (old_batch['rbStartTime'], batch_warning_days))
-            if (-1 == int(batch_warning_days)):
-                msg_continue = """
-                The configuration `batch_warning_days = -1` indicates that we want to continue
-                execution even if the input file did not change
-                """
-                logger.info(msg_continue)
-            else:
-
-                msg_quit = "The input file did not change in the past: %s days. Stop data import." % batch_warning_days
-                logger.critical(msg_quit)
-                redi_email.send_email_input_data_unchanged(email_settings)
-                sys.exit()
-        else:
-            logger.info('Reusing md5 entry: ' + str(old_batch['rbID']))
-    # return the old batch so we can update the status
-    return old_batch
-
-
-"""
-Retrieve the row corresponding to the last REDI batch completed
-"""
-
-
-def get_last_batch(db_path):
-    db = None
-    try:
-        db = lite.connect(db_path)
-        db.row_factory = dict_factory
-        cur = db.cursor()
-        sql = """
-SELECT
-    rbID, rbStartTime, rbEndTime, rbMd5Sum
-FROM
-    RediBatch
-ORDER BY rbID DESC
-LIMIT 1
-"""
-        cur.execute(sql)
-        batch = cur.fetchone()
-
-    except lite.Error as e:
-        logger.error("SQLite error in get_last_batch() for file %s - %s" % (db_path, e.args[0]))
-        return None
-    finally:
-        if db:
-            db.close()
-
-    return batch
-
-
-"""
-Retrieve the row corresponding to the specified primary key
-"""
-
-
-def get_batch_by_id(db_path, batch_id):
-    db = None
-    try:
-        db = lite.connect(db_path)
-        db.row_factory = dict_factory
-        cur = db.cursor()
-        sql = """
-SELECT
-    rbID, rbStartTime, rbEndTime, rbMd5Sum
-FROM
-    RediBatch
-WHERE
-    rbID = ?
-LIMIT 1
-"""
-        cur.execute(sql, (str(batch_id), ))
-        batch = cur.fetchone()
-
-    except lite.Error as e:
-        logger.exception("SQLite error in get_batch_by_id(): %s:" % e.args[0])
-        raise
-        # sys.exit(1)
-    finally:
-        if db:
-            db.close()
-
-    return batch
-
-
-"""
-@see #check_input_file()
-@see https://docs.python.org/2/library/hashlib.html
-@see https://docs.python.org/2/library/sqlite3.html#sqlite3.Connection.row_factory
-
-Returns the md5 sum for the redi input file
-"""
-
-
-def get_md5_input_file(input_file):
-    if not os.path.exists(input_file):
-        raise Exception('Input file not found at: ' + input_file)
-
-    logger.info('Computing md5 sum for: ' + input_file)
-
-    # open the file in binary mode
-    f = open(input_file, 'rb')
-    chunk_size = 2 ** 20
-    md5 = hashlib.md5()
-
-    # read the input file in 1MB pieces
-    while True:
-        chunk = f.read(chunk_size)
-        if not chunk:
-            break
-        md5.update(chunk)
-
-    return md5.hexdigest()
-
-
-"""
-@see #check_input_file()
-@param db_path - the SQLite file
-@param md5 - the md5 sum to be inserted
-"""
-
-
-def add_batch_entry(db_path, md5):
-    logger.info('Execute: add_batch_entry()')
-    batch = None
-
-    db = None
-    try:
-        db = lite.connect(db_path)
-        db.row_factory = dict_factory
-        cur = db.cursor()
-        sql = """
-INSERT INTO RediBatch
-    (rbStartTime, rbEndTime, rbStatus, rbMd5Sum)
-VALUES
-    ( ?, NULL, 'Started', ?)
-"""
-        now = get_db_friendly_date_time()
-        cur.execute(sql, (now, md5))
-        rbID = cur.lastrowid
-        db.commit()
-        batch = get_batch_by_id(db_path, rbID)
-
-    except lite.Error as e:
-        logger.error("SQLite error in add_batch_entry() for file %s - %s" % (db_path, e.args[0]))
-        return None
-    finally:
-        if db:
-            db.close()
-
-    return batch
-
-
-"""
-Update the status and the finish time of a specified batch entry in the SQLite db
-
-@return True if update succeeded, False otherwise
-"""
-
-
-def update_batch_entry(db_path, id, status, timestamp):
-    success = None
-    db = None
-    try:
-        db = lite.connect(db_path)
-        cur = db.cursor()
-        sql = """
-UPDATE
-    RediBatch
-SET
-    rbEndTime = ?
-    , rbStatus = ?
-WHERE
-    rbID = ?
-"""
-
-        cur.execute(sql, (timestamp, status, id))
-        db.commit()
-        scuccess = True
-    except lite.Error as e:
-        logger.exception("SQLite error in update_batch_entry(): %s:" % e.args[0])
-        success = False
-    finally:
-        if db:
-            db.close()
-
-    return success
-
-
-"""
-@return string in format: "2014-06-24 01:23:24"
-"""
-
-
-def get_db_friendly_date_time():
-    return datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
-
-"""
-@return string in format: 2014-06-24
-"""
-
-
-def get_db_friendly_date():
-    return date.today()
-
-"""
-@return the number of days passed since the specified date
-"""
-
-
-def get_days_since_today(date_string):
-    num = None
-    other = datetime.datetime.strptime(date_string, '%Y-%m-%d %H:%M:%S')
-    now = datetime.datetime.now()
-    delta = now - other
-    return delta.days
-
-"""
-Helper function for debugging xml content
-"""
-def printxml(tree):
-    print etree.tostring(tree, pretty_print = True)
-    return
diff --git a/bin/utils/report.xsd b/bin/utils/report.xsd
deleted file mode 100644
index 29d5dfb..0000000
--- a/bin/utils/report.xsd
+++ /dev/null
@@ -1,111 +0,0 @@
-<xs:schema attributeFormDefault="unqualified" elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">
-  <xs:element name="report">
-    <xs:complexType>
-      <xs:sequence>
-        <xs:element name="header">
-          <xs:complexType>
-            <xs:sequence>
-              <xs:element type="xs:string" name="project"/>
-              <xs:element type="xs:string" name="date"/>
-              <xs:element type="xs:string" name="redcapServerAddress"/>
-            </xs:sequence>
-          </xs:complexType>
-        </xs:element>
-        <xs:element name="summary">
-          <xs:complexType>
-            <xs:sequence>
-              <xs:element type="xs:byte" name="subjectCount"/>
-              <xs:element name="forms">
-                <xs:complexType>
-                  <xs:sequence>
-                    <xs:element name="form" maxOccurs="unbounded" minOccurs="0">
-                      <xs:complexType>
-                        <xs:sequence>
-                          <xs:element type="xs:string" name="form_name"/>
-                          <xs:element type="xs:byte" name="form_count"/>
-                        </xs:sequence>
-                      </xs:complexType>
-                    </xs:element>
-                  </xs:sequence>
-                </xs:complexType>
-              </xs:element>
-              <xs:element type="xs:byte" name="total_unique_dates"/>
-              <xs:element name="dates">
-                <xs:complexType>
-                  <xs:sequence>
-                    <xs:element type="xs:date" name="earliestDate"/>
-                    <xs:element type="xs:date" name="latestDate"/>
-                  </xs:sequence>
-                </xs:complexType>
-              </xs:element>
-            </xs:sequence>
-          </xs:complexType>
-        </xs:element>
-        <xs:element name="alerts">
-          <xs:complexType>
-            
-             <xs:sequence>
-              <xs:element name="tooManyForms">
-                <xs:complexType>
-                  <xs:sequence>
-                    <xs:element name="eventAlert" maxOccurs="unbounded" minOccurs="0">
-                      <xs:complexType>
-                        <xs:sequence>
-                          <xs:element type="xs:string" name="message"/>
-                        </xs:sequence>
-                      </xs:complexType>
-                    </xs:element>
-                  </xs:sequence>
-                </xs:complexType>
-              </xs:element>
-
-              <xs:element name="tooManyValues">
-                <xs:complexType>
-                  <xs:sequence>
-                    <xs:element name="valuesAlert" maxOccurs="unbounded" minOccurs="0">
-                      <xs:complexType>
-                        <xs:sequence>
-                          <xs:element type="xs:string" name="message"/>
-                        </xs:sequence>
-                      </xs:complexType>
-                    </xs:element>
-                  </xs:sequence>
-                </xs:complexType>
-              </xs:element>
-            </xs:sequence>
-          </xs:complexType>
-        </xs:element>
-        <xs:element name="subjectsDetails">
-          <xs:complexType>
-            <xs:sequence>
-              <xs:element name="Subject" maxOccurs="unbounded" minOccurs="0">
-                <xs:complexType>
-                  <xs:sequence>
-                    <xs:element type="xs:byte" name="ID"/>
-                    <xs:element name="forms">
-                      <xs:complexType>
-                        <xs:sequence>
-                          <xs:element name="form" maxOccurs="unbounded" minOccurs="0">
-                            <xs:complexType>
-                              <xs:sequence>
-                                <xs:element type="xs:string" name="form_name"/>
-                                <xs:element type="xs:byte" name="form_count"/>
-                              </xs:sequence>
-                            </xs:complexType>
-                          </xs:element>
-                        </xs:sequence>
-                      </xs:complexType>
-                    </xs:element>
-                    <xs:element type="xs:short" name="StudyPeriod"/>
-                    <xs:element type="xs:date" name="earliestdate"/>
-                    <xs:element type="xs:date" name="latestdate"/>
-                  </xs:sequence>
-                </xs:complexType>
-              </xs:element>
-            </xs:sequence>
-          </xs:complexType>
-        </xs:element>
-      </xs:sequence>
-    </xs:complexType>
-  </xs:element>
-</xs:schema>
\ No newline at end of file
diff --git a/config-example/report.xsl b/config-example/report.xsl
deleted file mode 100644
index 8d816ff..0000000
--- a/config-example/report.xsl
+++ /dev/null
@@ -1,157 +0,0 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0" xmlns:date="http://exslt.org/dates-and-times"
-                extension-element-prefixes="date">
-                <xsl:import href="date.month-abbreviation.template.xsl" />
-                <xsl:import href="date.year.template.xsl" />
-    <xsl:output method="html" version="4.0" encoding="UTF-8" indent="yes" />
-    <xsl:template match="/">
-        <html>
-            <head>
-                <style>table,th,td
-       {
-            border:1px solid black;
-            border-collapse:collapse;
-        }</style>
-                <title>Summary Report</title>
-            </head>
-            <body>
-               <h1>Data Import Report</h1>
-                <table>
-                    <tr>
-                        <td>
-                            <b>Project</b>
-                        </td>
-                        <td>
-                            <xsl:value-of select="report/header/project" />
-                        </td>
-                    </tr>
-                    <tr>
-                        <td>
-                            <b>Date</b>
-                        </td>
-                        <td>
-                            <xsl:value-of select="report/header/date" />
-                        </td>
-                    </tr>
-                    <tr>
-                        <td>
-                            <b>RedCapServerAddress</b>
-                        </td>
-                        <td>
-                            <xsl:value-of select="report/header/redcapServerAddress" />
-                        </td>
-                    </tr>
-                </table>
-                <br />
-                <h3>Summary</h3>
-                <table>
-                    <thead>
-                        <tr>
-                            <th>Total Subjects</th>
-                            <xsl:for-each select="report/summary/forms/form">
-                                <th>
-                                    <xsl:value-of select="form_name" />
-                                </th>    
-                            </xsl:for-each>
-                        </tr>
-                    </thead>
-                    <tbody>
-                        <tr>
-                            <td>
-                                <xsl:value-of select="report/summary/subjectCount" />
-                            </td>
-                            <xsl:for-each select="report/summary/forms/form">
-                                <td>
-                                    <xsl:value-of select="form_count"/>
-                                </td>    
-                            </xsl:for-each>
-                        </tr>
-                    </tbody>
-                </table>
-                <br />
-                <!-- Alerts start here -->
-                <!-- <h3>Import Alerts</h3> -->
-                <!-- check for not null -->
-                <!-- Commented out as the output is not fully de-identified-->
-                <!-- <xsl:if test="report/alerts/tooManyForms/eventAlert">
-                    <table>
-                        <thead>
-                            <tr>
-                                <th>Too many forms</th>
-                            </tr>
-                        </thead>
-                        <tbody>
-                            <xsl:for-each select="report/alerts/tooManyForms/eventAlert">
-                                <tr>
-                                    <td>
-                                        <xsl:value-of select="message" />
-                                    </td>
-                                </tr>
-                            </xsl:for-each>
-                        </tbody>
-                    </table>
-                    <br />
-                </xsl:if> -->
-                <!-- check for not null -->
-                <!-- Commented out as the output is not fully de-identified-->
-                <!-- <xsl:if test="report/alerts/tooManyValues/valuesAlert">
-                    <table>
-                        <thead>
-                            <tr>
-                                <th>Too many values</th>
-                            </tr>
-                        </thead>
-                        <tbody>
-                            <xsl:for-each select="report/alerts/tooManyValues/valuesAlert">
-                                <tr>
-                                    <td>
-                                        <xsl:value-of select="message" />
-                                    </td>
-                                </tr>
-                            </xsl:for-each>
-                        </tbody>
-                    </table>
-                </xsl:if>  -->
-                <br />
-                <h3>Subject Details</h3>
-                <table>
-                    <thead>
-                        <tr>
-                            <th>Subject</th>
-                            <xsl:for-each select="report/summary/forms/form">
-                                <th>
-                                    <xsl:value-of select="form_name" />
-                                </th>    
-                            </xsl:for-each>
-                        </tr>
-                    </thead>
-                    <tbody>
-                        <xsl:for-each select="report/subjectsDetails/Subject">
-                            <tr>
-                                <td>
-                                    <xsl:value-of select="ID" />
-                                </td>
-                                <xsl:for-each select="forms/form">
-                                <td>
-                                    <xsl:value-of select="form_count"/>
-                                </td>    
-                                </xsl:for-each>
-                            </tr>
-                        </xsl:for-each>
-                    </tbody>
-                </table>
-				<br />
-				                <h3>Errors</h3>
-				                <table>
-				                    <xsl:for-each select="report/errors/error">
-				                    <tr>
-				                        <td>
-				                                    <xsl:value-of select='.' />
-				                        </td>
-				                    </tr>
-				                    </xsl:for-each>
-				                </table>
-            </body>
-        </html>
-    </xsl:template>
-</xsl:stylesheet>
\ No newline at end of file
diff --git a/config-example/settings.ini b/config-example/settings.ini
index a8c5e1d..a0cb0ec 100644
--- a/config-example/settings.ini
+++ b/config-example/settings.ini
@@ -70,6 +70,10 @@ report_file_path = report.xml
 # Use this parameter to specify the file name for the report email stored in html format.
 # Optional parameter
 report_file_path2 = report.html
+
+# Optional parameter used to choose sorting of the data
+# in the summary email by `lab_id` or by `redcap_id`
+is_sort_by_lab_id = Y
 # --- /section_redi_emails
 # -------------------------------------------------------------------------------
 
diff --git a/docs/api/bin.rst b/docs/api/bin.rst
deleted file mode 100644
index 86e72a4..0000000
--- a/docs/api/bin.rst
+++ /dev/null
@@ -1,45 +0,0 @@
-bin package
-===========
-
-Subpackages
------------
-
-.. toctree::
-
-    bin.utils
-
-Submodules
-----------
-
-bin.form module
----------------
-
-.. automodule:: bin.form
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.redi module
----------------
-
-.. automodule:: bin.redi
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.redi_lib module
--------------------
-
-.. automodule:: bin.redi_lib
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-
-Module contents
----------------
-
-.. automodule:: bin
-    :members:
-    :undoc-members:
-    :show-inheritance:
diff --git a/docs/api/bin.utils.rst b/docs/api/bin.utils.rst
deleted file mode 100644
index 35295c1..0000000
--- a/docs/api/bin.utils.rst
+++ /dev/null
@@ -1,62 +0,0 @@
-bin.utils package
-=================
-
-Submodules
-----------
-
-bin.utils.GetEmrData module
----------------------------
-
-.. automodule:: bin.utils.GetEmrData
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.utils.SimpleConfigParser module
------------------------------------
-
-.. automodule:: bin.utils.SimpleConfigParser
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.utils.csv2xml module
-------------------------
-
-.. automodule:: bin.utils.csv2xml
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.utils.redcapClient module
------------------------------
-
-.. automodule:: bin.utils.redcapClient
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.utils.redcap_records module
--------------------------------
-
-.. automodule:: bin.utils.redcap_records
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-bin.utils.redi_email module
----------------------------
-
-.. automodule:: bin.utils.redi_email
-    :members:
-    :undoc-members:
-    :show-inheritance:
-
-
-Module contents
----------------
-
-.. automodule:: bin.utils
-    :members:
-    :undoc-members:
-    :show-inheritance:
diff --git a/docs/api/modules.rst b/docs/api/modules.rst
index c08f98d..14c3b5c 100644
--- a/docs/api/modules.rst
+++ b/docs/api/modules.rst
@@ -1,8 +1,7 @@
-..
-==
+redi
+====
 
 .. toctree::
    :maxdepth: 4
 
-   bin
-
+   redi
diff --git a/docs/api/redi.rst b/docs/api/redi.rst
new file mode 100644
index 0000000..d183a5c
--- /dev/null
+++ b/docs/api/redi.rst
@@ -0,0 +1,69 @@
+redi package
+============
+
+Subpackages
+-----------
+
+.. toctree::
+
+    redi.utils
+
+Submodules
+----------
+
+redi.batch module
+-----------------
+
+.. automodule:: redi.batch
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.form module
+----------------
+
+.. automodule:: redi.form
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.redi module
+----------------
+
+.. automodule:: redi.redi
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.redi_lib module
+--------------------
+
+.. automodule:: redi.redi_lib
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.report module
+------------------
+
+.. automodule:: redi.report
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.upload module
+------------------
+
+.. automodule:: redi.upload
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+
+Module contents
+---------------
+
+.. automodule:: redi
+    :members:
+    :undoc-members:
+    :show-inheritance:
diff --git a/docs/api/redi.utils.rst b/docs/api/redi.utils.rst
new file mode 100644
index 0000000..8d9969a
--- /dev/null
+++ b/docs/api/redi.utils.rst
@@ -0,0 +1,78 @@
+redi.utils package
+==================
+
+Submodules
+----------
+
+redi.utils.GetEmrData module
+----------------------------
+
+.. automodule:: redi.utils.GetEmrData
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.SimpleConfigParser module
+------------------------------------
+
+.. automodule:: redi.utils.SimpleConfigParser
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.csv2xml module
+-------------------------
+
+.. automodule:: redi.utils.csv2xml
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.rawxml module
+------------------------
+
+.. automodule:: redi.utils.rawxml
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.redcapClient module
+------------------------------
+
+.. automodule:: redi.utils.redcapClient
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.redcap_records module
+--------------------------------
+
+.. automodule:: redi.utils.redcap_records
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.redi_email module
+----------------------------
+
+.. automodule:: redi.utils.redi_email
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+redi.utils.throttle module
+--------------------------
+
+.. automodule:: redi.utils.throttle
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
+
+Module contents
+---------------
+
+.. automodule:: redi.utils
+    :members:
+    :undoc-members:
+    :show-inheritance:
diff --git a/docs/conf.py b/docs/conf.py
index 7f9a358..4e8aa45 100644
--- a/docs/conf.py
+++ b/docs/conf.py
@@ -21,8 +21,8 @@
 #sys.path.insert(0, os.path.abspath('.'))
 
 sys.path.insert(0, os.path.abspath('..'))
-from bin import redi
-from bin import redi_lib
+from redi import redi
+from redi import upload
 
 
 # -- General configuration ------------------------------------------------
diff --git a/docs/integration_testing.rst b/docs/integration_testing.rst
index c5f175b..97feb75 100644
--- a/docs/integration_testing.rst
+++ b/docs/integration_testing.rst
@@ -97,7 +97,7 @@ Erase the data in the correct project if necessary:
 
    ::
 
-        $ ../bin/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ -i demographic_test_data.csv
+        $ ../redi/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ -i demographic_test_data.csv
 
 On success the following text is returned:
 
@@ -119,7 +119,7 @@ On success the following text is returned:
        Find and adjust the "Rate Limiter" field to something like 60000
 
 
-       $ python ../bin/redi.py
+       $ python ../redi/redi.py
 
 If the output from the command above produces an exception then check if
 your IP was not banned due to numerous requests sent (@see related code
@@ -149,7 +149,7 @@ If the token is invalid the following error is returned:
 
    ::
 
-        $ ../bin/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ -f "demgraphics chemistry" > output_B.csv
+        $ ../redi/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ -f "demgraphics chemistry" > output_B.csv
 
 If you have a lot of forms, the output comparison is easier if you
 export the forms separately like this:
@@ -166,7 +166,7 @@ export the forms separately like this:
         
         for form in $forms
             do
-              ../bin/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ --forms=$form > $batch/$form.csv
+              ../redi/utils/redcap_records.py --token=121212 --url=http://localhost:8998/redcap/api/ --forms=$form > $batch/$form.csv
             done
 
 Later do the diff like this:
diff --git a/docs/test_sample_project_using_vagrant.rst b/docs/test_sample_project_using_vagrant.rst
index b63dad6..3aa4529 100644
--- a/docs/test_sample_project_using_vagrant.rst
+++ b/docs/test_sample_project_using_vagrant.rst
@@ -6,7 +6,7 @@ Purpose
 
 The "vagrant" folder was created with the goal of making testing `RED-I
 software <https://github.com/ctsit/redi>`__ as easy as possible. It
-contains the `Vagrantfile <../vagrant/Vagrantfile>`__ which allows to
+contains the `Vagrantfile <../vagrant/Vagrantfile>`__ which allows you to
 start a virtual machine capable of running the `REDCap
 software <http://http://www.project-redcap.org>`__ -- which means that
 during virtual machine creation the Apache and MySQL software is
@@ -56,13 +56,14 @@ Now execute the following commands to complete the configuration:
 .. raw:: html
 
    <pre>
+   cd ./vagrant    # must be in the redi/vagrant/ directory
    make copy_config_example
    make copy_redcap_code
    make copy_project_data
    make show_config
    </pre>
 
-Please verify that the output from "show\_config" matheches your
+Please verify that the output from "show\_config" matches your
 expectations.
 
 3. Start the VM
@@ -73,10 +74,13 @@ To use the vagrant VM you will need to install Vagrant and Virtual Box.
 With these packages installed, follow this procedure to use a VM
 template:
 
-::
+.. raw:: html
 
-    cd ./vagrant
-    vagrant up
+   <pre>
+   # must be in the redi/vagrant/ directory
+   cd ./vagrant
+   vagrant up
+   </pre>
 
 Vagrant will instantiate and provision the new VM. The REDCap web
 application should be accessible in the browser at
diff --git a/bin/__init__.py b/redi/__init__.py
similarity index 100%
rename from bin/__init__.py
rename to redi/__init__.py
diff --git a/redi/batch.py b/redi/batch.py
new file mode 100644
index 0000000..a567cde
--- /dev/null
+++ b/redi/batch.py
@@ -0,0 +1,378 @@
+"""
+Functions related to the RediBatch database
+"""
+
+__author__ = "University of Florida CTS-IT Team"
+__copyright__ = "Copyright 2014, University of Florida"
+__license__ = "BSD 3-Clause"
+
+import datetime
+import hashlib
+import logging
+import os
+import sqlite3 as lite
+import stat
+import sys
+import time
+
+from lxml import etree
+
+from utils import redi_email
+from utils.rawxml import RawXml
+
+
+logger = logging.getLogger(__name__)
+logger.addHandler(logging.NullHandler())
+
+
+"""
+@see #check_input_file()
+
+The first time we run the app there is no SQLite file
+where to store the md5 sums of the input file.
+This function creates an empty RediBatch in the SQLite
+file specified as `db_path`
+
+@return True if the database file was properly created with an empty table
+"""
+
+def create_empty_md5_database(db_path) :
+    if os.path.exists(db_path) :
+        logger.warn('The file with name ' + db_path + ' already exists')
+        #return
+
+    try :
+        logger.info('Opening the file:' + db_path)
+        fresh_file = open(db_path, 'w')
+        fresh_file.close()
+        os.chmod(db_path, stat.S_IRUSR | stat.S_IWUSR)
+        time.sleep(5)
+
+    except IOError as e:
+        logger.error("I/O error: " + e.strerror + ' for file: ' + db_path)
+        return False
+    success = create_empty_table(db_path)
+    return success
+
+"""
+Helper for #create_empty_md5_database()
+"""
+
+def create_empty_table(db_path) :
+    logger.info('exec create_empty_table')
+    db = None
+    try:
+        db = lite.connect(db_path)
+        cur = db.cursor()
+        sql = """CREATE TABLE RediBatch (
+    rbID INTEGER PRIMARY KEY AUTOINCREMENT,
+    rbStartTime TEXT NOT NULL,
+    rbEndTime TEXT,
+    rbStatus TEXT,
+    rbMd5Sum TEXT NOT NULL
+)
+        """
+        cur.execute(sql)
+
+    except lite.Error as e:
+        logger.error("SQLite error in create_empty_table(): " + e.args[0])
+        return False
+    finally:
+        if db:
+            db.close()
+    logger.info('success create_empty_table')
+    return True
+
+
+"""
+Use this function to set the `row_factory`
+attribute of the database connection
+"""
+
+
+def dict_factory(cursor, row):
+    d = {}
+    for idx, col in enumerate(cursor.description):
+        d[col[0]] = row[idx]
+    return d
+
+"""
+@see bin/redi.py#main()
+@return a dictionary representation of the batch row for the current run
+
+Check the md5sum of the input file
+    - if the sum *has changed* then continue the data processing and store a row
+        in the SQLite database with `batch status= batch_started/ batch_completed`
+
+    - if the sum *did not change* then check the config option `batch_warning_days`:
+        - if       limit = -1       then continue execution (ignore the limit)
+        - if days_passed > limit    then stop the process and email the `redi_admin`
+
+"""
+
+
+def check_input_file(batch_warning_days, db_path, email_settings, raw_xml_file, project):
+    batch = None
+
+    if not os.path.exists(db_path) :
+        create_empty_md5_database(db_path)
+
+    new_md5ive = get_md5_input_file(raw_xml_file)
+    new_msg = 'Using SQLite file: %s to store input file: %s md5 sum: %s' % (
+        db_path, raw_xml_file, new_md5ive)
+    logger.info(new_msg)
+
+    old_batch = get_last_batch(db_path)
+    old_md5ive = None
+    if old_batch:
+        old_md5ive = old_batch['rbMd5Sum']
+        logger.info('Old md5 sum for the input file is: ' + old_md5ive)
+    else:
+        # this is the first time the checksum feature is used
+        logger.info(
+            "There is no old md5 recorded yet for the input file. Continue data import...")
+        batch = add_batch_entry(db_path, new_md5ive)
+        record_msg = 'Added batch (rbID= %s, rbStartTime= %s, rbMd5Sum= %s' % (
+            batch['rbID'], batch['rbStartTime'], batch['rbMd5Sum'])
+        logger.info(record_msg)
+        return batch
+
+    if old_md5ive != new_md5ive:
+        # the data has changed... insert a new batch entry
+        batch = add_batch_entry(db_path, new_md5ive)
+        record_msg = 'Added batch (rbID= %s, rbStartTime= %s, rbMd5Sum= %s' % (
+            batch['rbID'], batch['rbStartTime'], batch['rbMd5Sum'])
+        logger.info(record_msg)
+        return batch
+    else:
+        days_since_today = get_days_since_today(old_batch['rbStartTime'])
+        # TODO: refactor code to use ConfigParser.RawConfigParser in order to
+        # preserve data types
+
+        if (days_since_today > int(batch_warning_days)):
+            raw_xml = RawXml(project, raw_xml_file)
+            msg_file_details = "\nXML file details: " + raw_xml.get_info()
+            logger.info('Last import was started on: %s which is more than the limit of %s' % (old_batch['rbStartTime'], batch_warning_days))
+            if (-1 == int(batch_warning_days)):
+                msg_continue = """
+                The configuration `batch_warning_days = -1` indicates that we want to continue
+                execution even if the input file did not change
+                """ + msg_file_details
+                logger.info(msg_continue)
+            else:
+
+                msg_quit = "The input file did not change in the past: %s days. Stop data import." % batch_warning_days
+                logger.critical(msg_quit + msg_file_details)
+                redi_email.send_email_input_data_unchanged(email_settings, raw_xml)
+                sys.exit()
+        else:
+            logger.info('Reusing md5 entry: ' + str(old_batch['rbID']))
+    # return the old batch so we can update the status
+    return old_batch
+
+
+
+"""
+Retrieve the row corresponding to the last REDI batch completed
+"""
+
+
+def get_last_batch(db_path):
+    db = None
+    try:
+        db = lite.connect(db_path)
+        db.row_factory = dict_factory
+        cur = db.cursor()
+        sql = """
+SELECT
+    rbID, rbStartTime, rbEndTime, rbMd5Sum
+FROM
+    RediBatch
+ORDER BY rbID DESC
+LIMIT 1
+"""
+        cur.execute(sql)
+        batch = cur.fetchone()
+
+    except lite.Error as e:
+        logger.error("SQLite error in get_last_batch() for file %s - %s" % (db_path, e.args[0]))
+        return None
+    finally:
+        if db:
+            db.close()
+
+    return batch
+
+
+"""
+Retrieve the row corresponding to the specified primary key
+"""
+
+
+def get_batch_by_id(db_path, batch_id):
+    db = None
+    try:
+        db = lite.connect(db_path)
+        db.row_factory = dict_factory
+        cur = db.cursor()
+        sql = """
+SELECT
+    rbID, rbStartTime, rbEndTime, rbMd5Sum
+FROM
+    RediBatch
+WHERE
+    rbID = ?
+LIMIT 1
+"""
+        cur.execute(sql, (str(batch_id), ))
+        batch = cur.fetchone()
+
+    except lite.Error as e:
+        logger.exception("SQLite error in get_batch_by_id(): %s:" % e.args[0])
+        raise
+        # sys.exit(1)
+    finally:
+        if db:
+            db.close()
+
+    return batch
+
+
+"""
+@see #check_input_file()
+@see https://docs.python.org/2/library/hashlib.html
+@see https://docs.python.org/2/library/sqlite3.html#sqlite3.Connection.row_factory
+
+Returns the md5 sum for the redi input file
+"""
+
+
+def get_md5_input_file(input_file):
+    if not os.path.exists(input_file):
+        raise Exception('Input file not found at: ' + input_file)
+
+    logger.info('Computing md5 sum for: ' + input_file)
+
+    # open the file in binary mode
+    f = open(input_file, 'rb')
+    chunk_size = 2 ** 20
+    md5 = hashlib.md5()
+
+    # read the input file in 1MB pieces
+    while True:
+        chunk = f.read(chunk_size)
+        if not chunk:
+            break
+        md5.update(chunk)
+
+    return md5.hexdigest()
+
+
+"""
+@see #check_input_file()
+@param db_path - the SQLite file
+@param md5 - the md5 sum to be inserted
+"""
+
+
+def add_batch_entry(db_path, md5):
+    logger.info('Execute: add_batch_entry()')
+    batch = None
+
+    db = None
+    try:
+        db = lite.connect(db_path)
+        db.row_factory = dict_factory
+        cur = db.cursor()
+        sql = """
+INSERT INTO RediBatch
+    (rbStartTime, rbEndTime, rbStatus, rbMd5Sum)
+VALUES
+    ( ?, NULL, 'Started', ?)
+"""
+        now = get_db_friendly_date_time()
+        cur.execute(sql, (now, md5))
+        rbID = cur.lastrowid
+        db.commit()
+        batch = get_batch_by_id(db_path, rbID)
+
+    except lite.Error as e:
+        logger.error("SQLite error in add_batch_entry() for file %s - %s" % (db_path, e.args[0]))
+        return None
+    finally:
+        if db:
+            db.close()
+
+    return batch
+
+
+"""
+Update the status and the finish time of a specified batch entry in the SQLite db
+
+@return True if update succeeded, False otherwise
+"""
+
+
+def update_batch_entry(db_path, id, status, timestamp):
+    success = None
+    db = None
+    try:
+        db = lite.connect(db_path)
+        cur = db.cursor()
+        sql = """
+UPDATE
+    RediBatch
+SET
+    rbEndTime = ?
+    , rbStatus = ?
+WHERE
+    rbID = ?
+"""
+
+        cur.execute(sql, (timestamp, status, id))
+        db.commit()
+        scuccess = True
+    except lite.Error as e:
+        logger.exception("SQLite error in update_batch_entry(): %s:" % e.args[0])
+        success = False
+    finally:
+        if db:
+            db.close()
+
+    return success
+
+
+"""
+@return string in format: "2014-06-24 01:23:24"
+"""
+
+
+def get_db_friendly_date_time():
+    return datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
+
+"""
+@return string in format: 2014-06-24
+"""
+
+
+def get_db_friendly_date():
+    return datetime.date.today()
+
+"""
+@return the number of days passed since the specified date
+"""
+
+
+def get_days_since_today(date_string):
+    num = None
+    other = datetime.datetime.strptime(date_string, '%Y-%m-%d %H:%M:%S')
+    now = datetime.datetime.now()
+    delta = now - other
+    return delta.days
+
+"""
+Helper function for debugging xml content
+"""
+def printxml(tree):
+    print etree.tostring(tree, pretty_print = True)
+    return
diff --git a/bin/form.py b/redi/form.py
similarity index 100%
rename from bin/form.py
rename to redi/form.py
diff --git a/bin/redi.py b/redi/redi.py
similarity index 87%
rename from bin/redi.py
rename to redi/redi.py
index 9a7b33a..a960aaf 100755
--- a/bin/redi.py
+++ b/redi/redi.py
@@ -31,7 +31,7 @@
 __author__ = "Nicholas Rejack"
 __copyright__ = "Copyright 2013, University of Florida"
 __license__ = "BSD 2-Clause"
-__version__ = "0.11.3"
+__version__ = "0.13.0"
 __email__ = "nrejack@ufl.edu"
 __status__ = "Development"
 
@@ -47,13 +47,17 @@
 import xml.etree.ElementTree as ET
 import sys
 import imp
-import argparse
 import os
+import pkg_resources
+import shutil
 
 from requests import RequestException
 from lxml import etree
 from docopt import docopt
 
+import batch
+import upload
+import report
 from utils import redi_email
 from utils.redcapClient import RedcapClient
 import utils.SimpleConfigParser as SimpleConfigParser
@@ -61,24 +65,6 @@
 from utils.GetEmrData import EmrFileAccessDetails
 
 
-def get_proj_root():
-    file_dir = os.path.dirname(os.path.realpath(__file__))
-    proj_root = os.path.abspath(os.path.join(file_dir, "../")) + '/'
-    return proj_root
-
-
-def get_db_path(batch_info_database, database_path):
-    if not os.path.exists(database_path):
-        os.makedirs(database_path)
-
-    db_path = os.path.join(database_path, batch_info_database)
-    return db_path
-
-
-proj_root = get_proj_root()
-import redi_lib
-
-
 # Command line default argument values
 _person_form_events_service = None
 
@@ -173,9 +159,32 @@ def main():
     redcap_client = connect_to_redcap(get_email_settings(settings),
                                       get_redcap_settings(settings), dry_run)
 
+    report_file_path = os.path.join(output_files,
+                                    settings.report_file_path)
+
+    report_creator = report.ReportCreator(report_file_path, settings.project,
+                                          settings.redcap_uri,
+                                          settings.is_sort_by_lab_id,
+                                          write_element_tree_to_file)
+
+    if settings.send_email:
+        report_courier = report.ReportEmailSender(get_email_settings(settings), logger)
+    else:
+        report_courier = report.ReportFileWriter(os.path.join(output_files,
+            settings.report_file_path2), logger)
+
     _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
          get_emr_data, settings, output_files, db_path, redcap_client,
-         args['--resume'], args['--skip-blanks'])
+         report_courier, report_creator, args['--resume'],
+         args['--skip-blanks'])
+
+
+def get_db_path(batch_info_database, database_path):
+    if not os.path.exists(database_path):
+        os.makedirs(database_path)
+
+    db_path = os.path.join(database_path, batch_info_database)
+    return db_path
 
 
 def _makedirs(data_folder):
@@ -192,6 +201,7 @@ def _delete_last_runs_data(data_folder):
     _remove(os.path.join(data_folder, 'alert_summary.obj'))
     _remove(os.path.join(data_folder, 'rule_errors.obj'))
     _remove(os.path.join(data_folder, 'collection_date_summary_dict.obj'))
+    _remove(os.path.join(data_folder, 'sent_events.idx'))
 
 
 def _remove(path):
@@ -207,10 +217,12 @@ def _fetch_run_data(data_folder):
     person_form_event_tree_with_data = _person_form_events_service.fetch()
     alert_summary = _load(os.path.join(data_folder, 'alert_summary.obj'))
     rule_errors = _load(os.path.join(data_folder, 'rule_errors.obj'))
-    collection_date_summary_dict = _load(os.path.join(data_folder, 'collection_date_summary_dict.obj'))
+    collection_date_summary_dict = _load(
+        os.path.join(data_folder, 'collection_date_summary_dict.obj'))
+    sent_events = SentEvents(os.path.join(data_folder, 'sent_events.idx'))
 
-    return alert_summary, person_form_event_tree_with_data, rule_errors,\
-     collection_date_summary_dict
+    return (alert_summary, person_form_event_tree_with_data, rule_errors,
+            collection_date_summary_dict, sent_events)
 
 
 def _load(path):
@@ -218,12 +230,14 @@ def _load(path):
         return pickle.load(fp)
 
 
-def _store_run_data(data_folder, alert_summary,\
- person_form_event_tree_with_data, rule_errors, collection_date_summary_dict):
+def _store_run_data(data_folder, alert_summary,
+                    person_form_event_tree_with_data, rule_errors,
+                    collection_date_summary_dict):
     _person_form_events_service.store(person_form_event_tree_with_data)
     _save(alert_summary, os.path.join(data_folder, 'alert_summary.obj'))
     _save(rule_errors, os.path.join(data_folder, 'rule_errors.obj'))
-    _save(collection_date_summary_dict, os.path.join(data_folder, 'collection_date_summary_dict.obj'))
+    _save(collection_date_summary_dict,
+          os.path.join(data_folder, 'collection_date_summary_dict.obj'))
 
 
 def _save(obj, path):
@@ -246,7 +260,7 @@ def connect_to_redcap(email_settings, redcap_settings, dry_run=False):
 
 def _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
          get_emr_data, settings, data_folder, database_path, redcap_client,
-         resume=False, skip_blanks=False):
+         report_courier, report_creator, resume=False, skip_blanks=False):
     global translational_table_tree
 
     assert _person_form_events_service is not None
@@ -274,7 +288,8 @@ def _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
     # status to `completed` an ste the `rbEndTime`
     email_settings = get_email_settings(settings)
     db_path = database_path
-    batch = _check_input_file(db_path, email_settings, raw_xml_file, settings)
+    current_batch = _check_input_file(db_path, email_settings, raw_xml_file,
+                                  settings)
 
     form_events_file = os.path.join(configuration_directory,\
      settings.form_events_file)
@@ -282,17 +297,6 @@ def _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
     translation_table_file = os.path.join(configuration_directory, \
         settings.translation_table_file)
 
-    report_file_path = os.path.join(configuration_directory,\
-     settings.report_file_path)
-
-    report_parameters = {
-        'report_file_path': report_file_path,
-        'project': settings.project,
-        'redcap_uri': settings.redcap_uri}
-
-    report_xsl = proj_root + "bin/utils/report.xsl"
-    send_email = settings.send_email
-
     if not resume:
         _delete_last_runs_data(data_folder)
 
@@ -306,26 +310,26 @@ def _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
                         person_form_event_tree_with_data, rule_errors,
                         collection_date_summary_dict)
 
-    alert_summary, person_form_event_tree_with_data, rule_errors, collection_date_summary_dict = \
-        _fetch_run_data(data_folder)
+    (alert_summary, person_form_event_tree_with_data, rule_errors,
+     collection_date_summary_dict, sent_events) = _fetch_run_data(data_folder)
 
     # Data will be sent to REDCap server and email will be sent only if
     # redi.py is not executing in dry run state.
     if not dry_run:
-        unsent_events = person_form_event_tree_with_data.xpath("//event/status[.='unsent']")
+        all_form_events = person_form_event_tree_with_data.xpath("//event")
 
         # Use the new method to communicate with REDCap
-        report_data = redi_lib.generate_output(
+        report_data = upload.generate_output(
             person_form_event_tree_with_data, redcap_client,
-            settings.rate_limiter_value_in_redcap, _person_form_events_service,
-            skip_blanks)
+            settings.rate_limiter_value_in_redcap, sent_events, skip_blanks)
 
         # write person_form_event_tree to file
         write_element_tree_to_file(person_form_event_tree_with_data,\
          os.path.join(data_folder, 'person_form_event_tree_with_data.xml'))
-        sent_events = person_form_event_tree_with_data.xpath("//event/status[.='sent']")
-        if len(unsent_events) != len(sent_events):
-            logger.warning('Some of the events are not sent to the redcap. Please check event statuses in '+data_folder+'person_form_event_tree_with_data.xml')
+        if len(all_form_events) != len(sent_events):
+            logger.warning(
+                'Some of the events were not sent to the REDCap server. Please '
+                "check the log file or {0}/sent_events.idx".format(data_folder))
 
         # Add any errors from running the rules to the report
         map(logger.warning, rule_errors)
@@ -334,76 +338,23 @@ def _run(config_file, configuration_directory, do_keep_gen_files, dry_run,
             report_data['errors'].extend(rule_errors)
 
         # create summary report
-        xml_report_tree = create_summary_report(report_parameters,
-                                            report_data, alert_summary,
-                                            collection_date_summary_dict)
-        # print etree.tostring(xml_report_tree)
-        report_xsl = proj_root + "bin/utils/report.xsl"
-        xslt = etree.parse(report_xsl)
-        transform = etree.XSLT(xslt)
-        html_report = transform(xml_report_tree)
-        html_str = etree.tostring(html_report, method='html', pretty_print=True)
-
-        if settings.send_email:
-            deliver_report_as_email(email_settings, html_str)
-        else:
-            deliver_report_as_file(settings.report_file_path2, html_str)
+        html_str = report_creator.create_report(
+            report_data, alert_summary, collection_date_summary_dict)
 
-    if batch:
+        report_courier.deliver(html_str)
+
+    if current_batch:
         # Update the batch row
-        done_timestamp = redi_lib.get_db_friendly_date_time()
-        redi_lib.update_batch_entry(db_path,
-                                    batch['rbID'], 'Completed', done_timestamp)
+        done_timestamp = batch.get_db_friendly_date_time()
+        batch.update_batch_entry(db_path, current_batch['rbID'], 'Completed',
+                                 done_timestamp)
 
     if dry_run:
         logger.info("End of dry run. All output files are ready for review"\
         " in " + data_folder)
 
     if not do_keep_gen_files:
-        redi_lib.delete_temporary_folder(data_folder)
-
-
-def deliver_report_as_file(html_report_path, html):
-    """
-    Deliver the summary report by writing it to a file
-    or logging it to the console if writing the file fails
-
-    :html_report_path the path where the report will be stored
-    :html the actual report content
-    """
-    problem_found = False
-    try:
-        report_file = open(html_report_path, 'w')
-    except (IOError, OSError) as e:
-        logger.exception('Could not open file: %s' % html_report_path)
-        problem_found = True
-    else:
-        try:
-            report_file.write(html)
-            logger.info("==> You can review the summary report by opening: {}"\
-                " in your browser".format(html_report_path))
-        except IOError:
-            logger.exception('Could not write file: %s' % html_report_path)
-            problem_found = True
-        finally:
-            report_file.close()
-    if problem_found:
-        logger.info("== Summary report ==" + html)
-
-
-def deliver_report_as_email(email_settings, html):
-    """
-    Deliver summary report as an email
-
-    :email_settings dictinary with email parameters
-    :html the actual report content
-    """
-    try:
-        redi_email.send_email_data_import_completed(email_settings, html)
-        logger.info("Summary report was emailed: parameter 'send_email = Y'")
-    except Exception as e:
-        logger.error("Unable to deliver the summary report due error: %s" % e)
-        deliver_report_as_file("report.html", html)
+        shutil.rmtree(data_folder)
 
 
 def _create_person_form_event_tree_with_data(
@@ -437,8 +388,8 @@ def _create_person_form_event_tree_with_data(
     # Convert COMPONENT_ID to loinc_code in the raw data
     component_to_loinc_code_xml = os.path.join(configuration_directory, \
                                   settings.component_to_loinc_code_xml)
-    component_to_loinc_code_xsd = proj_root + \
-                                  "bin/utils/component_id_to_loinc_code.xsd"
+    component_to_loinc_code_xsd = pkg_resources.resource_filename(
+        'redi', 'utils/component_id_to_loinc_code.xsd')
     component_to_loinc_code_xml_tree = validate_xml_file_and_extract_data \
         (component_to_loinc_code_xml, component_to_loinc_code_xsd)
     convert_component_id_to_loinc_code(data, component_to_loinc_code_xml_tree)
@@ -557,7 +508,9 @@ def _create_person_form_event_tree_with_data(
 
 
 def _check_input_file(db_path, email_settings, raw_xml_file, settings):
-    return redi_lib.check_input_file(settings.batch_warning_days, db_path, email_settings, raw_xml_file)
+    return batch.check_input_file(settings.batch_warning_days, db_path,
+                                  email_settings, raw_xml_file,
+                                  settings.project)
 
 
 def read_config(config_file, configuration_directory, file_list):
@@ -1087,16 +1040,25 @@ def research_id_to_redcap_id_converter(
     This function converts the research_id to redcap_id
      1. prepare a dictionary with [key, value] --> [study_id, redcap_id]
      2. replace the element tree study_id with the new redcap_id's
-     for each bad id, log it as warn
+     for each bad id, log it as warn.
+
+    Example of xml fragment produced:
+<subject lab_id="999-0001">
+    <NAME>HEMOGLOBIN</NAME>
+    <loinc_code>1534435</loinc_code>
+    <RESULT>1234</RESULT>
+...
+    <STUDY_ID>1</STUDY_ID> <!-- originally this was "999-0001" -->
+</subject>
+
+    Note: The next function which reads the "data" tree
+        is #create_empty_event_tree_for_study()
     """
-
     # read each of the study_id's from the data etree
     study_id_recap_id_dict = {}
 
-    ''' Configuration data from the mapping xml
-
-  '''
-    mapping_xml = os.path.join(configuration_directory,\
+    # Configuration data from the mapping xml
+    mapping_xml = os.path.join(configuration_directory,
      research_id_to_redcap_id)
 
     # read the field names from the research_id_to_redcap_id_map.xml
@@ -1107,26 +1069,21 @@ def research_id_to_redcap_id_converter(
             mapping_xml)
 
     mapping_data = etree.parse(mapping_xml)
-    redcap_id_field_name = mapping_data.getroot().findtext(
-        'redcap_id_field_name')
-    research_id_field_name = mapping_data.getroot().findtext(
-        'research_id_field_name')
+    root = mapping_data.getroot()
+    redcap_id_field_name = root.findtext('redcap_id_field_name')
+    research_id_field_name = root.findtext('research_id_field_name')
 
     if research_id_field_name is None or research_id_field_name == '':
         logger.error(
-            'research_id_field_name tag in file %s is not present',
-            mapping_xml)
+            'research_id_field_name tag in file %s is not present', mapping_xml)
         raise Exception(
-            'research_id_field_name tag in file %s is not present',
-            mapping_xml)
+            'research_id_field_name tag in file %s is not present', mapping_xml)
 
     if redcap_id_field_name is None or redcap_id_field_name == '':
         logger.error(
-            'redcap_id_field_name tag in file %s is not present',
-            mapping_xml)
+            'redcap_id_field_name tag in file %s is not present', mapping_xml)
         raise Exception(
-            'redcap_id_field_name tag in file %s is not present',
-            mapping_xml)
+            'redcap_id_field_name tag in file %s is not present', mapping_xml)
 
     # query the redcap for the response with redcap id's
     response = redcap_client.get_data_from_redcap(
@@ -1146,12 +1103,15 @@ def research_id_to_redcap_id_converter(
 
     for subject in data.iter('subject'):
         study_id = subject.findtext('STUDY_ID')
-        # tag = subject.find('STUDY_ID')
+
         # if the study id is not null populate the dictionary
         if study_id is not None and study_id != '' and study_id in redcap_dict:
-            # if the study_id in redcap_dict of redcap id's update the study_id
-            # with redcap id
-            subject.find('STUDY_ID').text = redcap_dict[study_id]
+            # if the study_id is in the dictionary then replace it by the redcap_id
+            lab_id_ele = subject.find('STUDY_ID')
+
+            # save the original subject id from the lab data as an attribute
+            subject.set('lab_id', lab_id_ele.text)
+            lab_id_ele.text = redcap_dict[study_id]
         elif study_id is not None and study_id != '' and study_id not in redcap_dict:
             # add the bad research id to list of bad ids
             bad_ids[study_id] += 1
@@ -1211,103 +1171,6 @@ def configure_logging(data_folder, verbose=False):
     return logger
 
 
-def create_summary_report(report_parameters, report_data, alert_summary, \
-    collection_date_summary_dict):
-    root = etree.Element("report")
-    root.append(etree.Element("header"))
-    root.append(etree.Element("summary"))
-    root.append(etree.Element("alerts"))
-    root.append(etree.Element("subjectsDetails"))
-    root.append(etree.Element("errors"))
-    root.append(etree.Element("summaryOfSpecimenTakenTimes"))
-    updateReportHeader(root, report_parameters)
-    updateReportSummary(root, report_data)
-    updateSubjectDetails(root, report_data['subject_details'])
-    updateReportAlerts(root, alert_summary)
-    updateReportErrors(root, report_data['errors'])
-    updateSummaryOfSpecimenTakenTimes(root, collection_date_summary_dict)
-    tree = etree.ElementTree(root)
-    write_element_tree_to_file(tree,report_parameters.get('report_file_path'))
-    return tree
-
-
-def updateReportHeader(root, report_parameters):
-    """ Update the passed `root` element tree with date, project name and url"""
-    header = root[0]
-    project = etree.SubElement(header, "project")
-    project.text = report_parameters.get('project')
-    date = etree.SubElement(header, "date")
-    date.text = time.strftime("%m/%d/%Y")
-    redcapServerAddress = etree.SubElement(header, "redcapServerAddress")
-    redcapServerAddress.text = report_parameters.get('redcap_uri')
-
-
-def updateReportSummary(root, report_data):
-    summary = root[1]
-    subjectCount = etree.SubElement(summary, "subjectCount")
-    subjectCount.text = str(report_data.get('total_subjects'))
-    forms = etree.SubElement(summary, "forms")
-    form_data = report_data['form_details']
-    for k in sorted(form_data.keys()):
-        form = etree.SubElement(forms, "form")
-        name_element = etree.SubElement(form, "form_name")
-        name_element.text = k
-        count_element = etree.SubElement(form, "form_count")
-        count_element.text = str(form_data.get(k))
-
-
-def updateReportAlerts(root, alert_summary):
-    alerts = root[2]
-    too_many_forms = etree.SubElement(alerts, 'tooManyForms')
-    too_many_values = etree.SubElement(alerts, 'tooManyValues')
-    for event in alert_summary['max_event_alert']:
-        event_alert = etree.SubElement(too_many_forms, 'eventAlert')
-        msg = etree.SubElement(event_alert, 'message')
-        msg.text = event
-    for value in alert_summary['multiple_values_alert']:
-        values_alert = etree.SubElement(too_many_values, 'valuesAlert')
-        msg = etree.SubElement(values_alert, 'message')
-        msg.text = value
-
-
-def updateSubjectDetails(root, subject_details):
-    subjectsDetails = root[3]
-    for key in sorted(subject_details.keys()):
-        subject = etree.SubElement(subjectsDetails, "Subject")
-        details = subject_details.get(key)
-        subjectId = etree.SubElement(subject, "ID")
-        subjectId.text = key
-        forms = etree.SubElement(subject, "forms")
-        for k in sorted(details.keys()):
-            if(k.endswith("_Forms")):
-                form = etree.SubElement(forms, "form")
-                name_element = etree.SubElement(form, "form_name")
-                name_element.text = k
-                count_element = etree.SubElement(form, "form_count")
-                count_element.text = str(details.get(k))
-            else:
-                element = etree.SubElement(subject, k)
-                element.text = str(details.get(k))
-
-
-def updateReportErrors(root, errors):
-    errorsRoot = root[4]
-    for error in errors:
-        errorElement = etree.SubElement(errorsRoot, "error")
-        errorElement.text = str(error)
-
-
-def updateSummaryOfSpecimenTakenTimes(root, collection_date_summary_dict):
-    timeSummaryRoot = root[5]
-    totalElement = etree.SubElement(timeSummaryRoot, "total")
-    totalElement.text = str(collection_date_summary_dict['total'])
-    blankElement = etree.SubElement(timeSummaryRoot, "blank")
-    blankElement.text = str(collection_date_summary_dict['blank'])
-    percentElement = etree.SubElement(timeSummaryRoot, "percent")
-    percentElement.text = str((float(collection_date_summary_dict['blank'])/\
-        collection_date_summary_dict['total'])*100)
-
-
 def create_empty_events_for_one_subject_helper(
         form_events_file,
         translation_table_file):
@@ -1327,7 +1190,7 @@ def create_empty_events_for_one_subject(
         form_events_tree,
         translation_table_tree):
     #logger.debug('Creating all form events template for one subject')
-    from lxml import etree
+
     root = etree.Element("all_form_events")
     form_event_root = form_events_tree.getroot()
     translation_table_root = translation_table_tree.getroot()
@@ -1400,13 +1263,15 @@ def create_empty_events_for_one_subject(
 
 def create_empty_event_tree_for_study(raw_data_tree, all_form_events_tree):
     """
-    This function uses raw_data_tree and all_form_events_tree and creates a person_form_event_tree for study
+    This function uses raw_data_tree and all_form_events_tree and creates
+    a person_form_event_tree for study
+
     :param raw_data_tree: This parameter holds raw data tree
     :param all_form_events_tree: This parameter holds all form events tree
     """
     logger.info('Creating all form events template for all subjects')
-    from lxml import etree
-    root = etree.Element("person_form_event")
+
+    pfe_element = etree.Element("person_form_event")
     raw_data_root = raw_data_tree.getroot()
     all_form_events_root = all_form_events_tree.getroot()
     if raw_data_root is None:
@@ -1414,31 +1279,33 @@ def create_empty_event_tree_for_study(raw_data_tree, all_form_events_tree):
     if all_form_events_root is None:
         raise Exception('All form Events tree is empty')
 
-    subjects_list = set()
+    subjects_dict = {}
 
+    # Collect the `study_id => lab_id` mappings
     for subject in raw_data_root.iter('subject'):
-        subjects_list.add(subject.find('STUDY_ID').text)
+        study_id = subject.findtext('STUDY_ID')
+        subjects_dict[study_id] = subject.attrib['lab_id']
 
-    if not subjects_list:
-        raise Exception('There is no subjects in the raw data')
+    if not subjects_dict:
+        raise Exception("There are no subjects in the raw data. " \
+                "This can be caused by an incorrect input file or "\
+                "by lack of enrollment data in the REDCap database." )
 
-    for subject_id in subjects_list:
+    for subject_id in subjects_dict.iterkeys():
         person = etree.Element("person")
+        # Copy `lab_id` attribute from `subject` to `person` element
+        person.set('lab_id', subjects_dict.get(subject_id))
         study_id = etree.SubElement(person, "study_id")
         study_id.text = subject_id
-        person.insert(
-            person.index(
-                person.find('study_id')) + 1,
-            etree.XML(
-                etree.tostring(
-                    all_form_events_root,
-                    method='html',
-                    pretty_print=True)))
-        root.append(person)
+        person_index = person.index(person.find('study_id')) + 1
 
-    tree = etree.ElementTree(root)
-    return tree
+        # insert the pretty-fied form events
+        pretty_form_events = etree.XML(
+            etree.tostring(all_form_events_root, method='html', pretty_print=True))
+        person.insert(person_index, pretty_form_events)
+        pfe_element.append(person)
 
+    return etree.ElementTree(pfe_element)
 
 def setStat(
         event,
@@ -2010,5 +1877,51 @@ def store(self, pfe_tree):
                        pretty_print=True)
 
 
+class SentEvents(object):
+    """
+    List of form events that have been sent to REDCap
+
+    :param filename: file location
+    :param writer: delegate called after an event has been marked sent
+    :param reader: function to read previously sent events from disk
+    """
+    def __init__(self, filename, writer=None, reader=None):
+        self.filename = filename
+        self._persist = writer or self._append
+        loader = reader or self._readall
+        self.sent_events = loader(filename)
+
+    def __len__(self):
+        return len(self.sent_events)
+
+    def mark_sent(self, study_id_key, form_name, event_name):
+        form_event_key = study_id_key, form_name, event_name
+        self.sent_events.append(form_event_key)
+        self._persist(self.sent_events, self.filename)
+
+    def was_sent(self, study_id_key, form_name, event_name):
+        form_event_key = study_id_key, form_name, event_name
+        return form_event_key in self.sent_events
+
+    @staticmethod
+    def _readall(filename):
+        # Reads events as a list of tuples (default reader delegate)
+        try:
+            with open(filename, 'r') as fp:
+                return [ast.literal_eval(line) for line in fp]
+        except IOError:
+            return []
+
+    @staticmethod
+    def _append(values, filename):
+        # Appends the last value to the file (default handler of on_marked_sent)
+        if not values:
+            return
+
+        with open(filename, 'a') as fp:
+            fp.write(str(values[-1]))
+            fp.write(os.linesep)
+
+
 if __name__ == "__main__":
     main()
diff --git a/redi/report.py b/redi/report.py
new file mode 100644
index 0000000..e5b9f9c
--- /dev/null
+++ b/redi/report.py
@@ -0,0 +1,227 @@
+import abc
+import time
+
+import pkg_resources
+from lxml import etree
+
+from utils import redi_email
+
+REDI_PACKAGE_NAME = 'redi'
+
+
+class ReportCourier(object):
+    @abc.abstractmethod
+    def deliver(self, report):
+        raise NotImplementedError()
+
+
+class ReportFileWriter(ReportCourier):
+    def __init__(self, output_file, logger):
+        self._output_file = output_file
+        self._logger = logger
+
+    def deliver(self, report):
+        """
+        Deliver the summary report by writing it to a file
+        or logging it to the console if writing the file fails
+
+        :html_report_path the path where the report will be stored
+        :html the actual report content
+        """
+        logger = self._logger
+        html_report_path = self._output_file
+        html = report
+
+        problem_found = False
+        try:
+            report_file = open(html_report_path, 'w')
+        except (IOError, OSError) as e:
+            logger.exception('Could not open file: %s' % html_report_path)
+            problem_found = True
+        else:
+            try:
+                report_file.write(html)
+                logger.info("==> You can review the summary report by opening: {}"\
+                    " in your browser".format(html_report_path))
+            except IOError:
+                logger.exception('Could not write file: %s' % html_report_path)
+                problem_found = True
+            finally:
+                report_file.close()
+        if problem_found:
+            logger.info("== Summary report ==" + html)
+
+
+class ReportEmailSender(ReportCourier):
+    def __init__(self, settings, logger):
+        self._settings = settings
+        self._logger = logger
+
+    def deliver(self, report):
+        """
+        Deliver summary report as an email
+
+        :email_settings dictinary with email parameters
+        :html the actual report content
+        """
+        logger = self._logger
+        email_settings = self._settings
+        html = report
+        # TODO: Replace this with a "backup_courier" constructor injection
+        deliver_report_as_file = self.__backup_courier_wrapper()
+
+        try:
+            redi_email.send_email_data_import_completed(email_settings, html)
+            logger.info("Summary report was emailed: parameter 'send_email = Y'")
+        except Exception as e:
+            logger.error("Unable to deliver the summary report due error: %s" % e)
+            deliver_report_as_file("report.html", html)
+
+    def __backup_courier_wrapper(self):
+        # Needed for backwards-compatibility with the old
+        # deliver_report_by_file() call from deliver_report_by_email()
+        logger = self._logger
+
+        def wrapper(filename, report):
+            return ReportFileWriter(filename, logger).deliver(report)
+
+        return wrapper
+
+
+class ReportCreator(object):
+    def __init__(self, report_file_path, project_name, redcap_uri,
+                 sort_by_lab_id, writer):
+        self._report_parameters = {
+            'report_file_path': report_file_path,
+            'project': project_name,
+            'redcap_uri': redcap_uri,
+            'is_sort_by_lab_id': sort_by_lab_id
+        }
+        self._writer = writer
+
+    def create_report(self, report_data, alert_summary, collection_date_summary_dict):
+        report_parameters = self._report_parameters
+        write_element_tree_to_file = self._writer
+
+        root = etree.Element("report")
+        root.append(etree.Element("header"))
+        root.append(etree.Element("summary"))
+        root.append(etree.Element("alerts"))
+        root.append(etree.Element("subjectsDetails"))
+        root.append(etree.Element("errors"))
+        root.append(etree.Element("summaryOfSpecimenTakenTimes"))
+        updateReportHeader(root, report_parameters)
+        updateReportSummary(root, report_data)
+        updateSubjectDetails(root, report_data['subject_details'])
+        updateReportAlerts(root, alert_summary)
+        updateReportErrors(root, report_data['errors'])
+        updateSummaryOfSpecimenTakenTimes(root, collection_date_summary_dict)
+
+        # TODO: remove dependency on the order of the xml elements in the report
+        sort_by_value = 'lab_id' if report_parameters['is_sort_by_lab_id'] else 'redcap_id'
+        root.append(gen_ele("sort_details_by", sort_by_value))
+
+        tree = etree.ElementTree(root)
+        write_element_tree_to_file(tree,report_parameters.get('report_file_path'))
+
+        report_xsl = pkg_resources.resource_filename(REDI_PACKAGE_NAME,
+                                                     'utils/report.xsl')
+        xslt = etree.parse(report_xsl)
+        transform = etree.XSLT(xslt)
+        html_report = transform(tree)
+        html_str = etree.tostring(html_report, method='html', pretty_print=True)
+
+        return html_str
+
+
+def updateReportHeader(root, report_parameters):
+    """ Update the passed `root` element tree with date, project name and url"""
+    header = root[0]
+    project = etree.SubElement(header, "project")
+    project.text = report_parameters.get('project')
+    date = etree.SubElement(header, "date")
+    date.text = time.strftime("%m/%d/%Y")
+    redcapServerAddress = etree.SubElement(header, "redcapServerAddress")
+    redcapServerAddress.text = report_parameters.get('redcap_uri')
+
+
+def updateReportSummary(root, report_data):
+    summary = root[1]
+    subjectCount = etree.SubElement(summary, "subjectCount")
+    subjectCount.text = str(report_data.get('total_subjects'))
+    forms = etree.SubElement(summary, "forms")
+    form_data = report_data['form_details']
+    for k in sorted(form_data.keys()):
+        form = etree.SubElement(forms, "form")
+        name_element = etree.SubElement(form, "form_name")
+        name_element.text = k
+        count_element = etree.SubElement(form, "form_count")
+        count_element.text = str(form_data.get(k))
+
+
+def updateReportAlerts(root, alert_summary):
+    alerts = root[2]
+    too_many_forms = etree.SubElement(alerts, 'tooManyForms')
+    too_many_values = etree.SubElement(alerts, 'tooManyValues')
+    for event in alert_summary['max_event_alert']:
+        event_alert = etree.SubElement(too_many_forms, 'eventAlert')
+        msg = etree.SubElement(event_alert, 'message')
+        msg.text = event
+    for value in alert_summary['multiple_values_alert']:
+        values_alert = etree.SubElement(too_many_values, 'valuesAlert')
+        msg = etree.SubElement(values_alert, 'message')
+        msg.text = value
+
+
+def updateSubjectDetails(root, subject_details):
+    """
+    Helper method for #create_summary_report()
+    Adds subject information to the xml tree which is later formated
+    by `redi/utils/report.xsl` into the html `table#subject_details"`
+    """
+    subjectsDetails = root[3]
+    for key in sorted(subject_details.keys()):
+        subject = etree.SubElement(subjectsDetails, "subject")
+        details = subject_details.get(key)
+        subject.append(gen_ele("redcap_id", key))
+        forms = etree.SubElement(subject, "forms")
+
+        for k in sorted(details.keys()):
+            if(k.endswith("_Forms")):
+                form = etree.SubElement(forms, "form")
+                name_element = etree.SubElement(form, "form_name")
+                name_element.text = k
+                count_element = etree.SubElement(form, "form_count")
+                count_element.text = str(details.get(k))
+            else:
+                element = etree.SubElement(subject, k)
+                element.text = str(details.get(k))
+
+
+def updateReportErrors(root, errors):
+    errorsRoot = root[4]
+    for error in errors:
+        errorElement = etree.SubElement(errorsRoot, "error")
+        errorElement.text = str(error)
+
+
+def updateSummaryOfSpecimenTakenTimes(root, collection_date_summary_dict):
+    timeSummaryRoot = root[5]
+    totalElement = etree.SubElement(timeSummaryRoot, "total")
+    totalElement.text = str(collection_date_summary_dict['total'])
+    blankElement = etree.SubElement(timeSummaryRoot, "blank")
+    blankElement.text = str(collection_date_summary_dict['blank'])
+    percentElement = etree.SubElement(timeSummaryRoot, "percent")
+    percentElement.text = str((float(collection_date_summary_dict['blank'])/\
+        collection_date_summary_dict['total'])*100)
+
+
+def gen_ele(ele_name, ele_text):
+    """ Create an xml element with given name and content """
+    return etree.XML("<{}>{}</{}>".format(ele_name, ele_text, ele_name))
+
+
+def gen_subele(parent, subele_name, subele_text):
+    subele = etree.SubElement(parent, subele_name)
+    subele.text = subele_text
+    return subele
diff --git a/redi/upload.py b/redi/upload.py
new file mode 100644
index 0000000..f1b7be9
--- /dev/null
+++ b/redi/upload.py
@@ -0,0 +1,232 @@
+"""
+Functions related to uploading data to REDCap
+"""
+
+__author__ = "University of Florida CTS-IT Team"
+__copyright__ = "Copyright 2014, University of Florida"
+__license__ = "BSD 3-Clause"
+
+import ast
+import datetime
+import logging
+import os
+
+from lxml import etree
+from redcap import RedcapError
+
+from utils import throttle
+
+logger = logging.getLogger(__name__)
+logger.addHandler(logging.NullHandler())
+
+DEFAULT_DATA_DIRECTORY = os.getcwd()
+
+
+def create_import_data_json(import_data_dict, event_tree):
+    """
+    create_import_data_json:
+    This function converts data in event tree into json format.
+    Parameters:
+        import_data_dict: This parameter holds the event tree data
+        event_tree: This parameter holds the event tree data
+
+    @see #generate_output()
+    """
+
+    root = event_tree
+
+    event_name = root.find('name')
+    if event_name is None or not event_name.text:
+        raise Exception('Expected non-blank element event/name')
+
+    import_data_dict['redcap_event_name'] = event_name.text
+
+    event_field_value_list = root.xpath('//event/field/name')
+
+    for name in event_field_value_list:
+        if name.text is None:
+            raise Exception(
+                'Expected non-blank element event/field/name')
+
+    # Match all fields to build a row for each
+    event_field_list = root.xpath('field')
+    contains_data = False
+
+    for field in event_field_list:
+        val = field.findtext('value', '')
+        import_data_dict[field.findtext('name')] = val
+
+        if val and not contains_data:
+            contains_data = True
+
+    return {'json_data': import_data_dict, 'contains_data': contains_data}
+
+
+def generate_output(person_tree, redcap_client, rate_limit, sent_events,
+                    skip_blanks=False):
+    """
+    Note: This function communicates with the redcap application.
+    Steps:
+        - loop for each person/form/event element
+        - generate a csv fragment `using create_eav_output`
+        - send csv fragment to REDCap using `send_eav_data_to_redcap`
+
+
+    @return the report_data dictionary
+    """
+
+    # the global dictionary to be returned
+    report_data = {
+        'errors': []
+    }
+
+    """
+     For each person we keep a count for each form type:
+        subject_details = array(
+            'person_A' => array('form_1': 1, 'form_2': 10, ...
+            'person_B' => array('form_1': 1, 'form_2': 10, ...
+            ...
+        )
+    """
+    subject_details = {}
+
+    # For each form type we keep a global count
+    form_details = {}
+
+    # count how many `person` elements are parsed
+    person_count = 0
+
+    root = person_tree.getroot()
+    persons = root.xpath('//person')
+
+    upload_data = throttle.Throttle(redcap_client.send_data_to_redcap,
+                                    int(rate_limit))
+
+    # main loop for each person
+    for person in persons:
+        time_begin = datetime.datetime.now()
+        person_count += 1
+        study_id = (person.xpath('study_id') or [None])[0]
+
+        if study_id is None:
+            raise Exception('Expected a valid value for study_id')
+
+        # count how many csv fragments are created per person
+        event_count = 0
+        logger.info('Start sending data for study_id: %s' % study_id.text)
+
+        forms = person.xpath('./all_form_events/form')
+
+        # loop through the forms of one person
+        for form in forms:
+            form_name = form.xpath('name')[0].text
+            form_key = 'Total_' + form_name + '_Forms'
+            study_id_key = study_id.text
+
+            # init dictionary for a new person in (study_id)
+            if study_id_key not in subject_details:
+                subject_details[study_id_key] = {}
+                subject_details[study_id_key]['lab_id'] = person.get('lab_id')
+
+            if not form_key in subject_details[study_id_key]:
+                subject_details[study_id_key][form_key] = 0
+
+            if form_key not in form_details:
+                form_details[form_key] = 0
+
+            logger.debug(
+                'parsing study_id ' +
+                study_id.text +
+                ' form: ' +
+                form_name)
+
+            # loop through the events of one form
+            for event in form.xpath('event'):
+                event_name = event.findtext('name', '')
+                assert event_name, "Missing name for form event"
+
+                if sent_events.was_sent(study_id_key, form_name, event_name):
+                    logger.debug("Skipping previously sent " + event_name)
+                    continue
+                event_count += 1
+
+                try:
+                    import_dict = {
+                        redcap_client.project.def_field: study_id.text}
+                    import_dict = create_import_data_json(
+                        import_dict,
+                        event)
+                    json_data_dict = import_dict['json_data']
+                    contains_data = import_dict['contains_data']
+
+                    # If we're skipping blanks and this event is blank, we
+                    # assume all following events are blank; therefore, break
+                    # out of this for-loop and move on to the next form.
+                    if skip_blanks and not contains_data:
+                        break
+
+                    if (0 == event_count % 50):
+                        logger.info('Requests sent: %s' % (event_count))
+
+                    # to speedup testing uncomment the following line
+                    # if (0 == event_count % 2) : continue
+
+                    try:
+                        found_error = False
+                        upload_data([json_data_dict], overwrite=True)
+                        sent_events.mark_sent(study_id_key, form_name, event_name)
+                        logger.debug("Sent " + event_name)
+                    except RedcapError as e:
+                        found_error = handle_errors_in_redcap_xml_response(
+                            e.message,
+                            report_data)
+
+                    if contains_data:
+                        if not found_error:
+                            # if no errors encountered update event counters
+                            subject_details[study_id_key][form_key] += 1
+                            form_details[form_key] += 1
+
+                except Exception as e:
+                    logger.error(e.message)
+                    raise
+
+        time_end = datetime.datetime.now()
+        logger.info("Total execution time for study_id %s was %s" % (study_id_key, (time_end - time_begin)))
+        logger.info("Total REDCap requests sent: %s \n" % (event_count))
+
+    report_data.update({
+        'total_subjects': person_count,
+        'form_details': form_details,
+        'subject_details': subject_details,
+        'errors': report_data['errors']
+    })
+
+    logger.debug('report_data ' + repr(report_data))
+    return report_data
+
+
+def handle_errors_in_redcap_xml_response(redcap_response, report_data):
+    """
+    handle_errors_in_redcap_xml_response:
+    This function checks for any errors in the redcap response and update report data if there are any errors.
+    Parameters:
+        redcap_response_xml: This parameter holds the redcap response passed to this function
+        report_data: This parameter holds the report data passed to this function
+
+    """
+    # converting string to dictionary
+    response = ast.literal_eval(str(redcap_response))
+    logger.debug('handling response from the REDCap')
+    try:
+        if 'error' in response:
+            for recordData in response['records']:
+                error_string = "Error writing to record " + recordData["record"] + " field " + recordData[
+                    "field_name"] + " Value " + recordData["value"] + ".Error Message: " + recordData["message"]
+                logger.info(error_string)
+                report_data['errors'].append(error_string)
+        else:
+            logger.error("REDCap response is in unknown format")
+    except KeyError as e:
+        logger.error(str(e))
+    return True
diff --git a/bin/utils/GetEmrData.py b/redi/utils/GetEmrData.py
similarity index 100%
rename from bin/utils/GetEmrData.py
rename to redi/utils/GetEmrData.py
diff --git a/bin/utils/SimpleConfigParser.py b/redi/utils/SimpleConfigParser.py
similarity index 99%
rename from bin/utils/SimpleConfigParser.py
rename to redi/utils/SimpleConfigParser.py
index 2258b50..b516c3d 100755
--- a/bin/utils/SimpleConfigParser.py
+++ b/redi/utils/SimpleConfigParser.py
@@ -120,6 +120,7 @@
     "emr_sftp_server_password": None,
     "emr_sftp_server_private_key": None,
     "emr_sftp_server_private_key_pass": None,
+    "is_sort_by_lab_id": True,
 }
 
 class ConfigurationError(Exception):
diff --git a/bin/utils/__init__.py b/redi/utils/__init__.py
similarity index 100%
rename from bin/utils/__init__.py
rename to redi/utils/__init__.py
diff --git a/bin/utils/component_id_to_loinc_code.xsd b/redi/utils/component_id_to_loinc_code.xsd
similarity index 100%
rename from bin/utils/component_id_to_loinc_code.xsd
rename to redi/utils/component_id_to_loinc_code.xsd
diff --git a/bin/utils/csv2xml.py b/redi/utils/csv2xml.py
similarity index 100%
rename from bin/utils/csv2xml.py
rename to redi/utils/csv2xml.py
diff --git a/bin/utils/date.month-abbreviation.template.xsl b/redi/utils/date.month-abbreviation.template.xsl
similarity index 100%
rename from bin/utils/date.month-abbreviation.template.xsl
rename to redi/utils/date.month-abbreviation.template.xsl
diff --git a/bin/utils/date.year.template.xsl b/redi/utils/date.year.template.xsl
similarity index 100%
rename from bin/utils/date.year.template.xsl
rename to redi/utils/date.year.template.xsl
diff --git a/redi/utils/rawxml.py b/redi/utils/rawxml.py
new file mode 100644
index 0000000..0039c1d
--- /dev/null
+++ b/redi/utils/rawxml.py
@@ -0,0 +1,52 @@
+import os.path
+import time
+import datetime
+
+class RawXml(object):
+    """
+    This class is used to store details about the input file
+    @see redi.batch.check_input_file()
+    """
+
+    def __init__(self, project, path):
+        """
+        Parameters
+        ----------
+        project : string
+            The project name - the owner of the xml file
+        path : string
+            The xml file path
+        """
+        self._project = project
+        self._path = path
+
+
+    def get_project(self):
+        return self._project
+
+    def get_creation_time(self):
+        """ Get the OS creation time """
+        #tst = time.ctime(os.path.getctime(self._path))
+        tst = os.path.getctime(self._path)
+        return datetime.datetime.fromtimestamp(tst)
+
+
+    def get_last_modified_time(self):
+        """ Get the OS modification time """
+        tst = os.path.getmtime(self._path)
+        return datetime.datetime.fromtimestamp(tst)
+
+
+    def get_info(self):
+        """
+        Return a string containing all details available about the xml file
+        """
+        info = """
+Project name: {0}
+File path: {1}
+File created: {2}
+File last modified: {3} """.format(self._project, \
+            self._path, \
+            self.get_creation_time(), \
+            self.get_last_modified_time())
+        return info
diff --git a/bin/utils/redcapClient.py b/redi/utils/redcapClient.py
similarity index 100%
rename from bin/utils/redcapClient.py
rename to redi/utils/redcapClient.py
diff --git a/bin/utils/redcap_records.py b/redi/utils/redcap_records.py
similarity index 100%
rename from bin/utils/redcap_records.py
rename to redi/utils/redcap_records.py
diff --git a/bin/utils/redi_email.py b/redi/utils/redi_email.py
similarity index 61%
rename from bin/utils/redi_email.py
rename to redi/utils/redi_email.py
index b825e58..b041905 100644
--- a/bin/utils/redi_email.py
+++ b/redi/utils/redi_email.py
@@ -2,6 +2,9 @@
 from smtplib import SMTPException
 from email.mime.text import MIMEText
 from email.mime.multipart import MIMEMultipart
+from email.MIMEBase import MIMEBase
+from email import Encoders
+from datetime import date
 import logging
 
 logger = logging.getLogger(__name__)
@@ -40,32 +43,65 @@ def send_email_redcap_connection_error(email_settings, subject='', msg=''):
     logger.error('Exception: Unable to communicate with REDCap instance at: ' + email_settings['redcap_uri'])
     return send_email(host, str(port), sender, to_addr_list, None, subject, msg)
 
-def send_email_input_data_unchanged(email_settings, subject='', msg=''):
+def send_email_input_data_unchanged(email_settings, raw_xml):
     """
     Send a warning email to the `redcap_support_receiver_email`
     if the input file did not change for more than `batch_warning_days`
+    Return True if the email was sent
 
-    :return True if the email was sent
+    Parameters
+    ----------
+    email_settings : dictionary
+        The email delivery parameters
+    raw_xml : RawXml instance
+        The object storing details about the input file
     """
     sender = email_settings['redcap_support_sender_email']
     to_addr_list = email_settings['redcap_support_receiving_list']
     host = email_settings['smtp_host_for_outbound_mail']
     port = email_settings['smtp_port_for_outbound_mail']
-    subject = 'Input data is static.'
+    subject = "The data for '{0}' project did not change in more than {1} days.".format(raw_xml.get_project(), email_settings['batch_warning_days'])
     msg = """
-    Administrators,
-    For the past {} days the input data for the REDI application did not change.
-    Please investigate.""".format(email_settings['batch_warning_days'])
+Administrators,
+    """ +  subject + """
+
+Please check if the input xml file is in the proper location.
+    """ + raw_xml.get_info()
     return send_email(host, str(port), sender, to_addr_list, None, subject, msg)
 
+
+def add_attachment(msg, body):
+    """
+    Add the html report as attachment
+
+    Parameters
+    ----------
+    msg : MIMEMultipart
+        The object to which we attach the body content
+    body : string
+        The html content to be attached
+    """
+    part = MIMEBase('application', "octet-stream")
+    part.set_payload(body)
+    Encoders.encode_base64(part)
+    file_name = "redi_report_{}.html".format(date.today())
+    part.add_header('Content-Disposition', \
+            'attachment; filename="{}"'.format(file_name))
+    msg.attach(part)
+
+
 def send_email_data_import_completed(email_settings, body=''):
     """
     Email the html report after redi completed the data transfer
-    :email_settings the dictionary produced by redi.get_email_settings()
-    :body: the html string produced by transforming the xsl
-        generated by redi.create_summary_report()
+    Returns a dictionary, with one entry for each recipient that was refused
 
-    :return a dictionary, with one entry for each recipient that was refused
+    Parameters
+    ----------
+    email_settings : dict
+        Email params produced by redi.get_email_settings()
+    body : string
+        The html content produced by transforming the xsl
+        generated by redi.create_summary_report()
     """
     sender = email_settings['batch_report_sender_email']
     to_addr_list = email_settings['batch_report_receiving_list']
@@ -77,17 +113,13 @@ def send_email_data_import_completed(email_settings, body=''):
     msg['To'] = ",".join(to_addr_list)
     msg['Subject'] = subject
     msg.attach(MIMEText(body, 'html'))
+    add_attachment(msg, body)
 
     refused_list = {}
-    try:
-        smtpObj = smtplib.SMTP(host, port)
-        refused_list = smtpObj.sendmail(sender, to_addr_list, msg.as_string())
-        logger.info("Successfully sent email to: " + str(to_addr_list))
-    except Exception:
-         logger.error("Unable to send email with subject [{}] to {}" \
-                .format(subject, str(to_addr_list)))
-         raise
-    smtpObj.quit()
+    smtp_obj = smtplib.SMTP(host, port)
+    refused_list = smtp_obj.sendmail(sender, to_addr_list, msg.as_string())
+    logger.info("Successfully sent email to: " + str(to_addr_list))
+    smtp_obj.quit()
     return refused_list
 
 def send_email(
@@ -99,10 +131,12 @@ def send_email(
         subject,
         msg_body):
     """
-    The email deliverer
-    :to_addr_list: must be a list not a string
+    The email deliverer. Return True if the email was sent
 
-    :return True if the email was sent
+    Parameters
+    ----------
+    to_addr_list : list
+        The recipients of the email
     """
     #print ('host %s, port: %s' % (host, port))
     success = False
@@ -122,12 +156,12 @@ def send_email(
             subject +
             '] was sent to:' +
             str(to_addr_list))
-    except SMTPException:
-        logger.error("Unable to send email with subject [{}] to {}" \
-                .format(subject, str(to_addr_list)))
+    except SMTPException as smtpe:
+        logger.error("Unable to send email with subject [{0}] to {1} due: {2}" \
+            .format(subject, str(to_addr_lista), str(smtpe)))
         logger.info("Please check if the recipient email is valid")
     except Exception as e:
-        logger.error("Unable to send email with subject [{}] to {}\n{}" \
-                .format(subject, str(to_addr_list), msg_body))
+        logger.error("Unable to send email with subject [{0}] to {1}\n due: {2}" \
+            .format(subject, str(to_addr_list), str(e)))
         logger.info("Please check if the smtp server is configured properly")
     return success
diff --git a/bin/utils/report.xsl b/redi/utils/report.xsl
similarity index 70%
rename from bin/utils/report.xsl
rename to redi/utils/report.xsl
index cf60ad2..154d33b 100644
--- a/bin/utils/report.xsl
+++ b/redi/utils/report.xsl
@@ -1,20 +1,47 @@
 <?xml version="1.0" encoding="UTF-8"?>
-<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0" xmlns:date="http://exslt.org/dates-and-times"
-                extension-element-prefixes="date">
-                <xsl:import href="date.month-abbreviation.template.xsl" />
-                <xsl:import href="date.year.template.xsl" />
-    <xsl:output method="html" version="4.0" encoding="UTF-8" indent="yes" />
-    <xsl:template match="/">
-        <html>
-            <head>
-                <style>table,th,td
-       {
-            border:1px solid black;
-            border-collapse:collapse;
-        }</style>
-                <title>Summary Report</title>
-            </head>
-            <body>
+<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
+<xsl:output method="html" version="4.0" encoding="UTF-8" indent="yes" />
+
+<xsl:variable name="sort_column" select="/report/sort_details_by" />
+
+<xsl:template match="/">
+<html>
+<head>
+<style>
+table, th, td {
+    border: 1px solid black;
+    border-collapse: collapse;
+}
+
+table#redi_summary thead,
+table#subject_details thead {
+    color: #fff;
+    background: #11772D;
+}
+
+table#subject_details tr:nth-child(odd) {
+    backround: #ccc;
+}
+
+table#errors thead {
+    color: #fff;
+    background: #D37C90;
+}
+</style>
+
+<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.11.1/jquery.min.js"></script>
+<link rel="stylesheet" href="http://ajax.googleapis.com/ajax/libs/jqueryui/1.11.1/themes/smoothness/jquery-ui.css" />
+<script src="http://ajax.googleapis.com/ajax/libs/jqueryui/1.11.1/jquery-ui.min.js"></script>
+<script src="http://tablesorter.com/__jquery.tablesorter.min.js"></script>
+<script>
+$(document).ready(function() {
+    $("#subject_details").tablesorter();
+    }
+);
+</script>
+    <title>Summary Report</title>
+</head>
+<body>
                <h1>Data Import Report</h1>
                 <table>
                     <tr>
@@ -44,16 +71,16 @@
                 </table>
                 <br />
                 <h3>Summary</h3>
-                <table>
+                <table id="redi_summary">
                     <thead>
                         <tr>
                             <th>Total Subjects</th>
                             <xsl:for-each select="report/summary/forms/form">
                                 <th>
                                     <xsl:value-of select="form_name" />
-                                </th>    
+                                </th>
                             </xsl:for-each>
-						</tr>
+                        </tr>
                     </thead>
                     <tbody>
                         <tr>
@@ -63,9 +90,9 @@
                             <xsl:for-each select="report/summary/forms/form">
                                 <td>
                                     <xsl:value-of select="form_count"/>
-                                </td>    
+                                </td>
                             </xsl:for-each>
-						</tr>
+                        </tr>
                     </tbody>
                 </table>
                 <br />
@@ -114,27 +141,40 @@
                 </xsl:if>
                 <br />
                 <h3>Subject Details</h3>
-                <table>
+                <table id="subject_details" class="tablesorter">
+                    <caption>
+                        <xsl:value-of select="
+                                concat(
+                                    'Number of forms for each of the ',
+                                    count(report/subjectsDetails/subject),
+                                    ' subject(s)') " />
+                    </caption>
                     <thead>
                         <tr>
-                            <th>Subject</th>
+                            <th>Subject ID</th>
+                            <th>Subject Number</th>
                             <xsl:for-each select="report/summary/forms/form">
                                 <th>
                                     <xsl:value-of select="form_name" />
-                                </th>    
+                                </th>
                             </xsl:for-each>
                         </tr>
                     </thead>
                     <tbody>
-                        <xsl:for-each select="report/subjectsDetails/Subject">
+                        <xsl:for-each select="report/subjectsDetails/subject">
+                            <xsl:sort select="*[name() = $sort_column]" order="ascending" />
+
                             <tr>
                                 <td>
-                                    <xsl:value-of select="ID" />
+                                    <xsl:value-of select="lab_id" />
+                                </td>
+                                <td>
+                                    <xsl:value-of select="redcap_id" />
                                 </td>
                                 <xsl:for-each select="forms/form">
                                 <td>
                                     <xsl:value-of select="form_count"/>
-                                </td>    
+                                </td>
                                 </xsl:for-each>
                             </tr>
                         </xsl:for-each>
@@ -142,7 +182,7 @@
                 </table>
                 <br />
                 <h3>Errors</h3>
-                <table>
+                <table id="errors">
                     <xsl:for-each select="report/errors/error">
                     <tr>
                         <td>
@@ -154,4 +194,4 @@
             </body>
         </html>
     </xsl:template>
-</xsl:stylesheet>
\ No newline at end of file
+</xsl:stylesheet>
diff --git a/redi/utils/throttle.py b/redi/utils/throttle.py
new file mode 100644
index 0000000..f67ce82
--- /dev/null
+++ b/redi/utils/throttle.py
@@ -0,0 +1,63 @@
+"""
+Utility module for throttling calls to a function
+"""
+
+import collections
+import datetime
+import time
+
+__author__ = "University of Florida CTS-IT Team"
+__copyright__ = "Copyright 2014, University of Florida"
+__license__ = "BSD 3-Clause"
+
+
+class Throttle(object):
+    """
+    Limits the number of calls to a function to a given rate.
+
+    The rate limit is equal to the max_calls over the interval_in_seconds.
+
+    :param function: function to call after throttling
+    :param max_calls: maximum number of calls allowed
+    :param interval_in_seconds: size of the sliding window
+    """
+    def __init__(self, function, max_calls, interval_in_seconds=60):
+        assert max_calls > 0
+        assert interval_in_seconds > 0
+
+        self._actual = function
+        self._max_requests = max_calls
+        self._interval = datetime.timedelta(seconds=interval_in_seconds)
+        self._timestamps = collections.deque(maxlen=self._max_requests)
+
+    def __call__(self, *args, **kwargs):
+        """ Conditionally delays before calling the function """
+        self._wait()
+        self._actual(*args, **kwargs)
+
+    def _limit_reached(self):
+        """ Returns True if the maximum number of calls has been reached """
+        return len(self._timestamps) == self._max_requests
+
+    @staticmethod
+    def _now():
+        # Used during unit testing
+        return datetime.datetime.now()
+
+    @staticmethod
+    def _sleep(seconds):
+        # Used during unit testing
+        return time.sleep(seconds)
+
+    def _wait(self):
+        """ Sleeps for the remaining interval if the limit has been reached """
+        now = self._now()
+
+        limit_reached = len(self._timestamps) == self._max_requests
+        if limit_reached:
+            lapsed = now - self._timestamps[0]
+            if lapsed <= self._interval:
+                self._sleep((self._interval - lapsed).total_seconds())
+                self._timestamps.clear()
+
+        self._timestamps.append(now)
diff --git a/scripts/create_enrollment_csv.bash b/scripts/create_enrollment_csv.bash
new file mode 100644
index 0000000..78f67ef
--- /dev/null
+++ b/scripts/create_enrollment_csv.bash
@@ -0,0 +1,17 @@
+#!/bin/bash
+#
+# Generates subject enrollment records which can be used with the Sample #
+# Project.
+#
+# Example:
+#
+#   bash add_subjects.bash 10 > ../config-example/enrollment_test_data.csv
+#
+
+echo "record_id,redcap_event_name,c2826694,c1301894,c2985782,c0806020,enrollment_complete"
+
+for i in $(seq 1 $1)
+do
+	echo "\"$i\",\"1_arm_1\",\"$i\",\"${i}007\",\"2112-01-03\",\"2113-01-01\",2";
+done
+
diff --git a/scripts/synthetic_data/README.md b/scripts/synthetic_data/README.md
index 6e21ac0..bf1fe36 100644
--- a/scripts/synthetic_data/README.md
+++ b/scripts/synthetic_data/README.md
@@ -1,23 +1,37 @@
 # Synthetic Data Tools
 
-makefakedata.R is a tool to create synthetic clinical lab data from simple template files.  These files can be used to create sample input data to be processed by RED-I and loaded into a REDCap system.
-
-Using a file that defines the components of a test panel, normal ranges for their values and typical units, makefakedata can create a file of lab results for that panel with multiple instances of that panel for multiple study subjects, over a range of dates.  The number of panels, research subjects, date ranges, input and output file names can all be controlled with parameters of makefakedata.
-
-makefakedata is designed to create sample datasets that are free of identifiers and any clinical history.  With no claim to ownership, no research value, and no history of private data, these files can be published as test datasets with any software project.
-
-Test data sets can be tailored to the needs of the individual software project via panel templates and input parameters.
+makefakedata.R is a tool to create synthetic clinical lab data from simple
+template files.
+These files can be used to create sample input data to be processed by RED-I
+and loaded into a REDCap system.
+
+Using a file that defines the components of a test panel, normal ranges for
+their values and typical units, makefakedata can create a file of lab results
+for that panel with multiple instances of that panel for multiple study
+subjects, over a range of dates.  The number of panels, research subjects, date
+ranges, input and output file names can all be controlled with parameters of
+makefakedata.
+
+makefakedata is designed to create sample datasets that are free of identifiers
+and any clinical history.  With no claim to ownership, no research value, and
+no history of private data, these files can be published as test datasets with
+any software project.
+
+Test data sets can be tailored to the needs of the individual software project
+via panel templates and input parameters.
 
 # Example
 
-In this example, 3 subjects are created in both the CBC and Chemistry output files.  For each subject, 7-20 panels of each test will be created.
+In this example, 3 subjects are created in both the CBC and Chemistry output
+files.  For each subject, 7-20 panels of each test will be created.
 
     chem <- makefakedata("chemistry_input.csv", "output-chem.csv", min_panel=7, max_panel=20, subject_count=3)
     cbc <-  makefakedata("cbc_input.csv", "output-cbc.csv", min_panel=7, max_panel=20, subject_count=3)
 
 # Panel Templates
 
-A template file is a CSV file containing a header row of column labels and one lab component per row.  Typical columns for the panel template are
+A template file is a CSV file containing a header row of column labels and one
+lab component per row.  Typical columns for the panel template are
 
 * loinc_component - a name that describe a lab component
 * loinc_code - the code for that lab component
@@ -27,7 +41,10 @@ A template file is a CSV file containing a header row of column labels and one l
 * panel - a lab panel on which these tests are likely to appear
 * loinc_long_common_name - a more descriptive name from LOINC
 
-The columns _low_ and _high_ define a range from which the result value will random chosen.  All other columns are strictly optional, but recommended.  The input values _loinc_component, loinc_code, low, high, and units_ in the input will appear in the output file without alteration.
+The columns _low_ and _high_ define a range from which the result value will
+random chosen.  All other columns are strictly optional, but recommended.
+The input values _loinc_component, loinc_code, low, high, and units_ in the
+input will appear in the output file without alteration.
 
 A typical panel template looks like this:
 
@@ -38,7 +55,8 @@ A typical panel template looks like this:
     Platelets,26515-7,0.172,0.45,10*3/uL,cbc,Platelets [#/volume] in Blood
     Hemoglobin,718-7,12,16,g/dl,cbc,Hemoglobin [Mass/volume] in Blood
 
-Here two CBC panels for one subject generated by makefakedata using the above panel template as an input.
+Here two CBC panels for one subject generated by makefakedata using the above
+panel template as an input.
 
     "result","loinc_component","loinc_code","low","high","units","date_time_stamp","study_id"
     3.813,"Leukocytes","26464-8",3.8,10.8,"10*3/uL",2112-10-27,1
@@ -54,6 +72,9 @@ Here two CBC panels for one subject generated by makefakedata using the above pa
 
 # Usage
 
+Accepted function arguments
+
+<pre>
     data <- makefakedata(
         input,
         output,
@@ -63,6 +84,16 @@ Here two CBC panels for one subject generated by makefakedata using the above pa
         start_date=<"Earliest date for a lab panel in YYYY-MM-DD format">,
         end_date=<"Latest date for a lab panel in YYYY-MM-DD format">,
         subject_count=<number of research subjects for which panels will be created>)
+</pre>
 
+Command line example:
 
+<pre>
+$ r
+$ source('makefakedata.R')
+$ makefakedata('example_input.csv', 'out.csv', subject_count=10)
+</pre>
 
+Notes:
+ - If min_panel = max_panel then 5 sets of data are generated
+ - Currently the code does not support integer numbers generation
diff --git a/setup.cfg b/setup.cfg
index d7d6b6f..b9f857c 100644
--- a/setup.cfg
+++ b/setup.cfg
@@ -3,7 +3,7 @@ description-file = README.md
 
 [nosetests]
 tests=test.TestSuite
-cover-package=bin
+cover-package=redi
 
 # Erase previously collected coverage statistics before run
 cover-erase=TRUE
diff --git a/setup.py b/setup.py
index 5d805bc..1d5f98c 100644
--- a/setup.py
+++ b/setup.py
@@ -18,17 +18,17 @@
 
 setup(
     name='redi-py',
-    version='0.12.0',
+    version='0.13.0',
     author='https://www.ctsi.ufl.edu/research/study-development/informatics-consulting/',
     author_email='cts-it-red@ctsi.ufl.edu',
     packages=find_packages(exclude=['test']),
     include_package_data=True,
     package_data={
-        'bin': ['utils/*.xsl', 'utils/*.xsd'],
+        'redi': ['utils/*.xsl', 'utils/*.xsd'],
         'redi': ['README.md'],
     },
     url='https://github.com/ctsit/redi',
-    download_url = 'https://github.com/ctsit/redi/releases/tag/0.12.0',
+    download_url = 'https://github.com/ctsit/redi/releases/tag/0.13.0',
     keywords = ['EMR', 'EHR', 'REDCap', 'Clinical Data'],
     license='BSD 3-Clause',
     description='REDCap Electronic Data Importer',
@@ -42,12 +42,13 @@
     ],
     entry_points={
         'console_scripts': [
-            'redi = bin.redi:main',
+            'redi = redi.redi:main',
         ],
     },
     test_suite='test.TestSuite',
     tests_require=[
         "mock >= 1.0",
+        "sftpserver >= 0.2",
     ],
     setup_requires=[
         "nose >= 1.0",
diff --git a/test/TestAddElementsToTree.py b/test/TestAddElementsToTree.py
index 7577bf4..f501dc8 100644
--- a/test/TestAddElementsToTree.py
+++ b/test/TestAddElementsToTree.py
@@ -1,6 +1,6 @@
 import unittest
 from lxml import etree
-import redi
+from redi import redi
 
 class TestAddElementsToTree(unittest.TestCase):
 
diff --git a/test/TestConvertComponentIdToLoincCode.py b/test/TestConvertComponentIdToLoincCode.py
index 25bdbd6..05e85db 100644
--- a/test/TestConvertComponentIdToLoincCode.py
+++ b/test/TestConvertComponentIdToLoincCode.py
@@ -8,7 +8,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestCopyDataToPersonFormEventTree.py b/test/TestCopyDataToPersonFormEventTree.py
index cf3dd81..4ef20fe 100644
--- a/test/TestCopyDataToPersonFormEventTree.py
+++ b/test/TestCopyDataToPersonFormEventTree.py
@@ -3,7 +3,7 @@
 
 from lxml import etree
 
-from bin import redi
+from redi import redi
 
 
 class TestCopyDataToPersonFormEventTree(unittest.TestCase):
diff --git a/test/TestCreateEmptyEventTreeForStudy.py b/test/TestCreateEmptyEventTreeForStudy.py
index 48b7f33..fe696e6 100644
--- a/test/TestCreateEmptyEventTreeForStudy.py
+++ b/test/TestCreateEmptyEventTreeForStudy.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
@@ -12,39 +12,36 @@
 class TestCreateEmptyEventTreeForStudy(unittest.TestCase):
 
     def setUp(self):
-        self.all_form_events = """<all_form_events><form>
-		<name>cbc</name>
-		<event>
-    		<name>1_arm_1</name>
-		<field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field></event>
-		
-		
-        </form>
-        <form>
-            <name>chemistry</name>
+        self.all_form_events = """
+<all_form_events>
+    <form>
+        <name>cbc</name>
+        <event>
+            <name>1_arm_1</name>
+            <field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/>
+            </field>
+        </event>
+    </form>
+    <form>
+        <name>chemistry</name>
+        <event>
+            <name>1_arm_1</name>
+            <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/>
+            </field>
+        </event>
+    </form>
+    <form>
+        <name>inr</name>
             <event>
-		        <name>1_arm_1</name>
-		    <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field></event>
-		
-		
-        </form>
-
-	    <form>
-		    <name>inr</name>
-		    <event>
-		    <name>1_arm_1</name>
-		    <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field></event>
-		
-	       </form>
-	
-        </all_form_events>
+                <name>1_arm_1</name>
+                <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field>
+            </event>
+    </form>
+</all_form_events>
         """
-        
         self.data_all_form_events= etree.ElementTree(etree.fromstring(self.all_form_events))
-        
         return()
 
-
     def test_create_empty_event_tree_for_study_for_zero_subjects(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.zero_subjects = """<?xml version='1.0' encoding='US-ASCII'?>
@@ -57,7 +54,7 @@ def test_create_empty_event_tree_for_study_for_one_subjects(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.one_subject = """<?xml version='1.0' encoding='US-ASCII'?>
             <study>
-            <subject>
+            <subject lab_id="999-123">
             <NAME>TestSubject</NAME>
             <loinc_code>123456</loinc_code>
             <RESULT>123</RESULT>
@@ -71,43 +68,47 @@ def test_create_empty_event_tree_for_study_for_one_subjects(self):
             """
         self.data_one_subject= etree.ElementTree(etree.fromstring(self.one_subject))
         
-        self.output_one_subject = """<person_form_event><person><study_id>123</study_id><all_form_events><form>
-		<name>cbc</name>
-		<event>
-    		<name>1_arm_1</name>
-		<field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field></event>
-		
-		
-        </form>
+        self.output_one_subject = """
+<person_form_event>
+    <person lab_id="999-123">
+        <study_id>123</study_id>
+        <all_form_events>
+        <form>
+            <name>cbc</name>
+            <event>
+                <name>1_arm_1</name>
+                <field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field>
+            </event>
+            </form>
         <form>
             <name>chemistry</name>
             <event>
-		        <name>1_arm_1</name>
-		    <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field></event>
-		
-		
+                <name>1_arm_1</name>
+                <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field>
+                </event>
         </form>
-
-	    <form>
-		    <name>inr</name>
-		    <event>
-		    <name>1_arm_1</name>
-		    <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field></event>
-		
-	       </form>
-	
-        </all_form_events></person></person_form_event>
+        <form>
+            <name>inr</name>
+            <event>
+            <name>1_arm_1</name>
+            <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field></event>
+           </form>
+        </all_form_events>
+    </person>
+</person_form_event>
         """
         self.expect_one_subject = etree.tostring(etree.fromstring(self.output_one_subject))
-        
-        self.result = etree.tostring(redi.create_empty_event_tree_for_study(self.data_one_subject,self.data_all_form_events))
-        self.assertEqual(self.expect_one_subject, self.result)
-       
+        self.result = etree.tostring(
+            redi.create_empty_event_tree_for_study(self.data_one_subject,self.data_all_form_events))
+        clean_expected = ''.join(self.expect_one_subject.split())
+        clean_result = ''.join(self.result.split())
+        self.assertEqual(clean_expected, clean_result)
+
     def test_create_empty_event_tree_for_study_for_two_subjects(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.two_subjects = """<?xml version='1.0' encoding='US-ASCII'?>
             <study>
-                <subject>
+                <subject lab_id="999-123">
                 <NAME>TestSubject_1</NAME>
                 <loinc_code>123456</loinc_code>
                 <RESULT>123</RESULT>
@@ -117,7 +118,7 @@ def test_create_empty_event_tree_for_study_for_two_subjects(self):
                 <DATE_TIME_STAMP/>
                 <STUDY_ID>123</STUDY_ID>
             <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus></subject>
-            <subject>
+            <subject lab_id="999-1234">
             <NAME>TestSubject_2</NAME>
             <loinc_code>123456</loinc_code>
             <RESULT>123</RESULT>
@@ -131,62 +132,68 @@ def test_create_empty_event_tree_for_study_for_two_subjects(self):
             """
         self.data_two_subjects= etree.ElementTree(etree.fromstring(self.two_subjects))
         
-        self.output_two_subjects = """<person_form_event><person><study_id>1234</study_id><all_form_events><form>
-		<name>cbc</name>
-		<event>
-    		<name>1_arm_1</name>
-		<field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field></event>
-		
-		
+        self.output_two_subjects = """
+<person_form_event>
+    <person lab_id="999-1234">
+        <study_id>1234</study_id>
+        <all_form_events>
+        <form>
+            <name>cbc</name>
+            <event>
+                <name>1_arm_1</name>
+                <field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field>
+            </event>
         </form>
         <form>
             <name>chemistry</name>
             <event>
-		        <name>1_arm_1</name>
-		    <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field></event>
-		
-		
+                <name>1_arm_1</name>
+                <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field>
+            </event>
         </form>
-
-	    <form>
-		    <name>inr</name>
-		    <event>
-		    <name>1_arm_1</name>
-		    <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field></event>
-		
-	       </form>
-	
-        </all_form_events></person><person><study_id>123</study_id><all_form_events><form>
-		<name>cbc</name>
-		<event>
-    		<name>1_arm_1</name>
-		<field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field></event>
-		
-		
+        <form>
+            <name>inr</name>
+            <event>
+                <name>1_arm_1</name>
+                <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field>
+            </event>
+        </form>
+        </all_form_events>
+    </person>
+    <person lab_id="999-123">
+        <study_id>123</study_id>
+        <all_form_events>
+        <form>
+            <name>cbc</name>
+            <event>
+                <name>1_arm_1</name>
+                <field><name>lymce_lborres</name><value/></field><field><name>lymce_lborresu</name><value/></field><field><name>hemo_lborresu</name><value/></field><field><name>cbc_lbdtc</name><value/></field><field><name>cbc_nximport</name><value/></field><field><name>lymce_lbstat</name><value/></field><field><name>cbc_complete</name><value/></field><field><name>hemo_lbstat</name><value/></field><field><name>hemo_lborres</name><value/></field>
+            </event>
         </form>
         <form>
             <name>chemistry</name>
             <event>
-		        <name>1_arm_1</name>
-		    <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field></event>
-		
-		
+                <name>1_arm_1</name>
+                <field><name>k_lborres</name><value/></field><field><name>chem_lbdtc</name><value/></field><field><name>sodium_lborresu</name><value/></field><field><name>k_lbstat</name><value/></field><field><name>sodium_lbstat</name><value/></field><field><name>chem_nximport</name><value/></field><field><name>chemistry_complete</name><value/></field><field><name>k_lborresu</name><value/></field><field><name>sodium_lborres</name><value/></field>
+            </event>
         </form>
-
-	    <form>
-		    <name>inr</name>
-		    <event>
-		    <name>1_arm_1</name>
-		    <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field></event>
-		
-	       </form>
-	
-        </all_form_events></person></person_form_event>
+        <form>
+            <name>inr</name>
+            <event>
+                <name>1_arm_1</name>
+                <field><name>inr_lbdtc</name><value/></field><field><name>inr_complete</name><value/></field><field><name>inr_nximport</name><value/></field>
+            </event>
+        </form>
+        </all_form_events>
+    </person>
+</person_form_event>
         """
         self.expect_two_subjects = etree.tostring(etree.fromstring(self.output_two_subjects))
-        
-        self.result = etree.tostring(redi.create_empty_event_tree_for_study(self.data_two_subjects,self.data_all_form_events))
-        self.assertEqual(self.expect_two_subjects, self.result)
+        self.result = etree.tostring(
+            redi.create_empty_event_tree_for_study(self.data_two_subjects,self.data_all_form_events))
+        clean_expected = ''.join(self.expect_two_subjects.split())
+        clean_result = ''.join(self.result.split())
+        self.assertEqual(clean_expected, clean_result)
 
     def tearDown(self):
         return()
diff --git a/test/TestCreateEmptyEventsForOneSubject.py b/test/TestCreateEmptyEventsForOneSubject.py
index 498faf2..f76e1e0 100644
--- a/test/TestCreateEmptyEventsForOneSubject.py
+++ b/test/TestCreateEmptyEventsForOneSubject.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestCreateImportDataJson.py b/test/TestCreateImportDataJson.py
index e74a77b..d884da1 100755
--- a/test/TestCreateImportDataJson.py
+++ b/test/TestCreateImportDataJson.py
@@ -17,36 +17,24 @@
 from lxml import etree
 import logging
 import os
-import redi
-import redi_lib
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
+from redi import upload
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
+
 class TestCreateImportDataJson(unittest.TestCase):
 
     def setUp(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.CONST_STUDY_ID = 73
-         
-        global logger
-        logger = logging.getLogger('redi')
-        logging.basicConfig(filename=proj_root+'log/redi.log',
-                        format='%(asctime)s - %(levelname)s - \
-                        %(name)s - %(message)s',
-                        datefmt='%m/%d/%Y %H:%M:%S',
-                        filemode='w',
-                        level=logging.DEBUG)
         return()
 
     ############################
     # == TEST_1
     def test_empty_event(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
-        logger.info("Running " + __name__ 
+        logging.info("Running " + __name__ 
             + "#test_empty_event() using study_id: " + `self.CONST_STUDY_ID`)
         # Case 1 input string
         string_1_empty_event = """
@@ -55,14 +43,14 @@ def test_empty_event(self):
 """
         out_dict_1 = {'study_id':self.CONST_STUDY_ID}
         etree_1 = etree.ElementTree(etree.fromstring(string_1_empty_event))
-        self.assertRaises(Exception, redi_lib.create_import_data_json, out_dict_1, etree_1)
+        self.assertRaises(Exception, upload.create_import_data_json, out_dict_1, etree_1)
         
 
 
     ############################
     # == TEST_2
     def test_empty_event_field_value(self):
-        logger.info("Running " + __name__ 
+        logging.info("Running " + __name__ 
             + "#test_empty_value() for study_id: " + `self.CONST_STUDY_ID`)
         # Case 2 input string
         string_2_empty_values = """
@@ -102,14 +90,14 @@ def test_empty_event_field_value(self):
         etree_2 = etree.ElementTree(etree.fromstring(string_2_empty_values))
         out_dict_2 = {'study_id':self.CONST_STUDY_ID}
         expected_result_dict_2 = {'contains_data': False, 'json_data': {'chem_complete': '', 'redcap_event_name': '1_arm_1', 'tbil_lborres': '', 'study_id': 73, 'chem_nximport': '', 'tbil_lborresu': '', 'chem_lbdtc': ''}}
-        actual_result = redi_lib.create_import_data_json(out_dict_2, etree_2)
+        actual_result = upload.create_import_data_json(out_dict_2, etree_2)
         self.assertEqual(expected_result_dict_2,actual_result)
 
 
     ############################
     # == Test_3
     def test_mixed_event_field_value(self):
-        logger.info("Running " + __name__ 
+        logging.info("Running " + __name__ 
             + "#test_mixed_event_field_value() for study_id: " + `self.CONST_STUDY_ID`)
 
 
@@ -148,7 +136,7 @@ def test_mixed_event_field_value(self):
 """
         etree_3 = etree.ElementTree(etree.fromstring(string_3_mixed))
         out_dict_3 = {'study_id':self.CONST_STUDY_ID}
-        actual_result = redi_lib.create_import_data_json(out_dict_3, etree_3)
+        actual_result = upload.create_import_data_json(out_dict_3, etree_3)
         expected_result = {'contains_data': True, 'json_data': {'chem_complete': '2', 'redcap_event_name': '1_arm_1', 'tbil_lborres': '1.7', 'study_id': 73, 'chem_nximport': 'Y', 'tbil_lborresu': '', 'chem_lbdtc': '1902-12-17'}}
         self.assertEqual(actual_result, expected_result)
 
@@ -156,7 +144,7 @@ def test_mixed_event_field_value(self):
     ############################
     # == TEST_4
     def test_empty_event_field_name(self):
-        logger.info("Running " + __name__ 
+        logging.info("Running " + __name__ 
             + "#test_empty_event_field_name() for study_id: " + `self.CONST_STUDY_ID`)
 
         # Case 4 input string
@@ -186,11 +174,11 @@ def test_empty_event_field_name(self):
 </event> """
         etree_4 = etree.ElementTree(etree.fromstring(string_4_blank_name))
         out_dict_4 = {'study_id':self.CONST_STUDY_ID}
-        self.assertRaises(Exception, redi_lib.create_import_data_json, out_dict_4, etree_4)
+        self.assertRaises(Exception, upload.create_import_data_json, out_dict_4, etree_4)
 
     # Verify if code checks for blank `event/name`
     def test_empty_event_name(self):
-        logger.info("Running " + __name__
+        logging.info("Running " + __name__
             + "#test_empty_event_name() for study_id: " + `self.CONST_STUDY_ID`)
 
         string_4a_blank_name = """
@@ -202,19 +190,19 @@ def test_empty_event_name(self):
     </field>
 </event> """
         etree_4a = etree.ElementTree(etree.fromstring(string_4a_blank_name))
-        self.assertRaises(Exception, redi_lib.create_import_data_json, self.CONST_STUDY_ID, etree_4a)
+        self.assertRaises(Exception, upload.create_import_data_json, self.CONST_STUDY_ID, etree_4a)
 
     ############################
     # == TEST_5
     def test_empty_study_id(self) :
-        logger.info("Running " + __name__ 
+        logging.info("Running " + __name__ 
             + "#test_empty_study_id() for study_id: ''")
         string_1_empty_event = """
 <event></event>
 """
         string_5_out = "error_study_id_empty"
         etree_1 = etree.ElementTree(etree.fromstring(string_1_empty_event))
-        self.assertRaises(Exception, redi_lib.create_import_data_json,None, etree_1)
+        self.assertRaises(Exception, upload.create_import_data_json,None, etree_1)
 
     def test_multiple_event(self):
         # motivated by bug 5996
@@ -231,7 +219,7 @@ def test_multiple_event(self):
         second_event = form.xpath('//event')[1]
         out_dict_3 = {'study_id':self.CONST_STUDY_ID}
 
-        output = redi_lib.create_import_data_json(out_dict_3, second_event)
+        output = upload.create_import_data_json(out_dict_3, second_event)
         self.assertTrue(output['contains_data'])
         self.assertFalse('42_arm_42' in output['json_data']['redcap_event_name'])
         self.assertTrue('no_arm' in output['json_data']['redcap_event_name'])
diff --git a/test/TestCreateSummaryReport.py b/test/TestCreateSummaryReport.py
index 239ce7b..64e3388 100644
--- a/test/TestCreateSummaryReport.py
+++ b/test/TestCreateSummaryReport.py
@@ -7,11 +7,8 @@
 from lxml import etree
 from StringIO import StringIO
 import time
-import redi
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
+from redi import report
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
@@ -21,8 +18,10 @@ def setUp(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.test_report_params = {
             'project': 'hcvtarget-uf',
-            'report_file_path': proj_root + 'config/report.xml',
-            'redcap_uri': 'https://hostname.org'}
+            'report_file_path': os.path.join(DEFAULT_DATA_DIRECTORY, 'unittest_report.xml'),
+            'redcap_uri': 'https://hostname.org',
+            'is_sort_by_lab_id': True,
+            }
 
         self.test_report_data = {
             'total_subjects': 5,
@@ -31,10 +30,10 @@ def setUp(self):
                 'Total_cbc_Forms': 53
             },
             'subject_details': {
-                '60': {'cbc_Forms': 1, 'chemistry_Forms': 1},
-                '61': {'cbc_Forms': 2, 'chemistry_Forms': 1},
-                '63': {'cbc_Forms': 11, 'chemistry_Forms': 4},
-                '59': {'cbc_Forms': 39, 'chemistry_Forms': 16}
+                '60': {'cbc_Forms': 1, 'chemistry_Forms': 1, 'lab_id': '999-0060'},
+                '61': {'cbc_Forms': 2, 'chemistry_Forms': 1, 'lab_id': '999-0061'},
+                '63': {'cbc_Forms': 11, 'chemistry_Forms': 4, 'lab_id': '999-0063'},
+                '59': {'cbc_Forms': 39, 'chemistry_Forms': 16, 'lab_id': '999-0059'}
             },
             'errors' : [],
         }
@@ -92,7 +91,8 @@ def setUp(self):
         </valuesAlert></tooManyValues>
     </alerts>
     <subjectsDetails>
-        <Subject><ID>59</ID>
+        <subject>
+        <redcap_id>59</redcap_id>
         <forms>
             <form>
                 <form_name>cbc_Forms</form_name>
@@ -103,9 +103,10 @@ def setUp(self):
                 <form_count>16</form_count>
             </form>
         </forms>
-        </Subject>
-        <Subject>
-            <ID>60</ID>
+        <lab_id>999-0059</lab_id>
+        </subject>
+        <subject>
+            <redcap_id>60</redcap_id>
             <forms>
                 <form>
                     <form_name>cbc_Forms</form_name>
@@ -115,8 +116,10 @@ def setUp(self):
                     <form_count>1</form_count>
                 </form>
             </forms>
-        </Subject>
-        <Subject><ID>61</ID>
+            <lab_id>999-0060</lab_id>
+        </subject>
+        <subject>
+            <redcap_id>61</redcap_id>
             <forms>
                 <form>
                     <form_name>cbc_Forms</form_name>
@@ -127,9 +130,10 @@ def setUp(self):
                     <form_count>1</form_count>
                 </form>
             </forms>
-        </Subject>
-        <Subject>
-            <ID>63</ID>
+            <lab_id>999-0061</lab_id>
+        </subject>
+        <subject>
+            <redcap_id>63</redcap_id>
             <forms>
                 <form>
                     <form_name>cbc_Forms</form_name>
@@ -140,7 +144,8 @@ def setUp(self):
                     <form_count>4</form_count>
                 </form>
             </forms>
-        </Subject>
+            <lab_id>999-0063</lab_id>
+        </subject>
     </subjectsDetails>
     <errors/>
     <summaryOfSpecimenTakenTimes>
@@ -148,6 +153,7 @@ def setUp(self):
         <blank>3</blank>
         <percent>20.0</percent>
     </summaryOfSpecimenTakenTimes>
+    <sort_details_by>lab_id</sort_details_by>
 </report>'''
 
         self.schema_str = StringIO('''\
@@ -222,10 +228,10 @@ def setUp(self):
         <xs:element name="subjectsDetails">
           <xs:complexType>
             <xs:sequence>
-              <xs:element name="Subject" maxOccurs="unbounded" minOccurs="0">
+              <xs:element name="subject" maxOccurs="unbounded" minOccurs="0">
                 <xs:complexType>
                   <xs:sequence>
-                    <xs:element type="xs:byte" name="ID"/>
+                    <xs:element type="xs:int" name="redcap_id"/>
                     <xs:element name="forms">
                       <xs:complexType>
                         <xs:sequence>
@@ -240,6 +246,7 @@ def setUp(self):
                         </xs:sequence>
                       </xs:complexType>
                     </xs:element>
+                    <xs:element type="xs:string" name="lab_id"/>
                   </xs:sequence>
                 </xs:complexType>
               </xs:element>
@@ -257,6 +264,7 @@ def setUp(self):
             </xs:sequence>
           </xs:complexType>
         </xs:element>
+        <xs:element name="sort_details_by"></xs:element>
       </xs:sequence>
     </xs:complexType>
   </xs:element>
@@ -264,40 +272,49 @@ def setUp(self):
         return
 
     def test_create_summary_report(self):
-
+        """
+        Validates the summary xml structure using xsd
+        Validate the summary xml content
+        """
         sys.path.append('config')
-        self.newpath = proj_root+'config'
-        self.configFolderCreatedNow = False
-        if not os.path.exists(self.newpath):
-            self.configFolderCreatedNow = True
-            os.makedirs(self.newpath)
 
-        result = redi.create_summary_report(\
-                self.test_report_params, \
-                self.test_report_data, \
-                self.test_alert_summary, \
-                self.specimen_taken_time_summary)
+        class MockWriter(object):
+            def __call__(self, *args, **kwargs):
+                #expected call: write(tree, report_file_path)
+                self.result = args[0]
+        writer = MockWriter()
+
+        creator = report.ReportCreator(
+            self.test_report_params['report_file_path'],
+            self.test_report_params['project'],
+            self.test_report_params['redcap_uri'],
+            self.test_report_params['is_sort_by_lab_id'],
+            writer)
+
+        creator.create_report(self.test_report_data, self.test_alert_summary,
+                              self.specimen_taken_time_summary)
+
+        result = writer.result
+
         result_string = etree.tostring(result)
         #print result_string
         xmlschema_doc = etree.parse(self.schema_str)
         xml_schema = etree.XMLSchema(xmlschema_doc)
         # validate the xml against the xsd schema
         self.assertEqual(xml_schema.validate(result), True)
+
         # validate the actual data in xml but strip the white space first
         parser = etree.XMLParser(remove_blank_text=True)
         clean_tree = etree.XML(self.expected_xml, parser=parser)
         self.expected_xml = etree.tostring(clean_tree)
-
         self.assertEqual(self.expected_xml, result_string)
 
     def tearDown(self):
         # delete the created xml file
-        with open(proj_root + 'config/report.xml'):
-            os.remove(proj_root + 'config/report.xml')
-
-            if self.configFolderCreatedNow:
-                os.rmdir(self.newpath)
-        return
+        try:
+            os.remove(self.test_report_params['report_file_path'])
+        except:
+            pass
 
 if __name__ == '__main__':
     unittest.main()
diff --git a/test/TestDaysSinceToday.py b/test/TestDaysSinceToday.py
index 885b2e6..0e96317 100644
--- a/test/TestDaysSinceToday.py
+++ b/test/TestDaysSinceToday.py
@@ -1,11 +1,9 @@
 import unittest
 import datetime
 from datetime import timedelta
-import redi_lib
-
+from redi import batch
 
 class TestDaysSinceToday(unittest.TestCase):
-
     """
     Verify the difference from a past date
     Verify the difference from a future date
@@ -14,10 +12,10 @@ def test(self):
         past10 = datetime.datetime.now() - timedelta(days = 10)
         future11 = datetime.datetime.now() + timedelta(days = 11)
 
-        diff_past = redi_lib.get_days_since_today( str(past10.strftime('%Y-%m-%d %H:%M:%S') ) )
+        diff_past = batch.get_days_since_today( str(past10.strftime('%Y-%m-%d %H:%M:%S') ) )
         self.assertEqual(10, diff_past)
 
-        diff_future = redi_lib.get_days_since_today( str(future11.strftime('%Y-%m-%d %H:%M:%S') ) )
+        diff_future = batch.get_days_since_today( str(future11.strftime('%Y-%m-%d %H:%M:%S') ) )
         self.assertEqual(-11, diff_future)
 
 
diff --git a/test/TestGenerateOutput.py b/test/TestGenerateOutput.py
index c5e9bb0..1d12544 100755
--- a/test/TestGenerateOutput.py
+++ b/test/TestGenerateOutput.py
@@ -16,9 +16,9 @@
 import unittest
 import os
 from lxml import etree
-import redi
-import redi_lib
-from utils.redcapClient import RedcapClient
+from redi import redi
+from redi import upload
+from redi.utils.redcapClient import RedcapClient
 
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
@@ -33,11 +33,9 @@ class dummyClass:
         def_field = 'test'
 
     def test_person_form_event(self):
-        redi.logger.info("Running " + __name__ 
-            + "#test_person_form_event() using xml: " )
         string_1_xml = """
 <person_form_event>
-    <person>
+    <person lab_id="999-0100">
         <study_id>100</study_id>
         <all_form_events>
             <form>
@@ -63,7 +61,7 @@ def test_person_form_event(self):
  
         </all_form_events>
     </person>
-    <person>
+    <person lab_id="999-0099">
         <study_id>99</study_id>
         <all_form_events>
             <form>
@@ -112,7 +110,7 @@ def test_person_form_event(self):
             </form>
         </all_form_events>
     </person>
-    <person>
+    <person lab_id="999-0098">
         <study_id>98</study_id>
         <all_form_events>
             <form>
@@ -144,9 +142,9 @@ def test_person_form_event(self):
 
         form_details    = {'Total_cbc_Forms': 2, 'Total_inr_Forms': 3}
         subject_details = {
-            '98'  : {'Total_cbc_Forms' : 0, 'Total_inr_Forms' : 1 },
-            '99'  : {'Total_cbc_Forms' : 1, 'Total_inr_Forms' : 1 },
-            '100' : {'Total_cbc_Forms' : 1, 'Total_inr_Forms' : 1 }
+                '98'  : {'Total_cbc_Forms' : 0, 'Total_inr_Forms' : 1, 'lab_id': "999-0098" },
+                '99'  : {'Total_cbc_Forms' : 1, 'Total_inr_Forms' : 1, "lab_id": "999-0099" },
+                '100' : {'Total_cbc_Forms' : 1, 'Total_inr_Forms' : 1, "lab_id": "999-0100" }
         } 
  
         report_data = {
@@ -156,9 +154,20 @@ def test_person_form_event(self):
             'errors'                : []
         }
 
-        class MockDataRepository(object):
-            def store(self, data):
-                pass
+        class MockSentEventIndex(object):
+            def __init__(self):
+                self.sent_events = []
+
+            def __len__(self):
+                return len(self.sent_events)
+
+            def mark_sent(self, study_id_key, form_name, event_name):
+                form_event_key = study_id_key, form_name, event_name
+                self.sent_events.append(form_event_key)
+
+            def was_sent(self, study_id_key, form_name, event_name):
+                form_event_key = study_id_key, form_name, event_name
+                return form_event_key in self.sent_events
 
         class MockRedcapClient(RedcapClient):
             def __init__(self):
@@ -175,8 +184,8 @@ def send_data_to_redcap(self, data, overwrite=False):
                 return """Data sent"""
 
         etree_1 = etree.ElementTree(etree.fromstring(string_1_xml))
-        result = redi_lib.generate_output(etree_1, MockRedcapClient(), 500,
-                                          MockDataRepository())
+        result = upload.generate_output(etree_1, MockRedcapClient(), 500,
+                                        MockSentEventIndex())
         self.assertEqual(report_data['total_subjects'], result['total_subjects'])
         self.assertEqual(report_data['form_details'], result['form_details'])
         self.assertEqual(report_data['subject_details'], result['subject_details'])
diff --git a/test/TestGetEMRData.py b/test/TestGetEMRData.py
index 4472aff..9e58d4d 100644
--- a/test/TestGetEMRData.py
+++ b/test/TestGetEMRData.py
@@ -5,8 +5,8 @@
 import tempfile
 import pysftp
 from mock import patch
-import utils.GetEmrData as GetEmrData
-from utils.GetEmrData import EmrFileAccessDetails
+from redi.utils import GetEmrData
+from redi.utils.GetEmrData import EmrFileAccessDetails
 
 import time
 from subprocess import Popen
diff --git a/test/TestHandleREDCapResponse.py b/test/TestHandleREDCapResponse.py
index ffa6e2e..7e15a12 100644
--- a/test/TestHandleREDCapResponse.py
+++ b/test/TestHandleREDCapResponse.py
@@ -1,27 +1,27 @@
 import unittest
 import os
-import redi
-import redi_lib
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
+from redi import upload
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
 class TestHandleErrorsInREDCapResponse(unittest.TestCase):
 
+    """ Variables setup """
     def setUp(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         return()
 
 
     def test_handle_errors_in_redcap_xml_response_valid_case(self):
+        """ Test the correctness of function
+        upload.handle_errors_in_redcap_xml_response
+        """
         self.redcap_error = """{"error": "There were data validation errors","records": [{"record": "1 (1_arm_1)", "field_name": "wbc_lborres",
 								"value": "5.4",
 								"message": "This field is located on a form that is locked. You must first unlock this form for this record"}]}"""
         self.report_data = {'errors':[]}
-        self.assertTrue(redi_lib.handle_errors_in_redcap_xml_response(self.redcap_error,self.report_data))
+        self.assertTrue(upload.handle_errors_in_redcap_xml_response(self.redcap_error, self.report_data))
         
     # Below code is made obsolete because we are handling errors only in case of exceptions.We are not checking for errors in valid cases anymore.
     # def test_handle_errors_in_redcap_xml_response_with_no_error(self):
@@ -36,7 +36,7 @@ def test_handle_errors_in_redcap_xml_response_with_no_errorKey_in_report_data(se
 								"value": "5.4",
 								"message": "This field is located on a form that is locked. You must first unlock this form for this record"}]}"""
         self.report_data = {}
-        self.assertTrue(redi_lib.handle_errors_in_redcap_xml_response(self.redcap_pass,self.report_data))
+        self.assertTrue(upload.handle_errors_in_redcap_xml_response(self.redcap_pass, self.report_data))
         
 
     def tearDown(self):
diff --git a/test/TestLog.py b/test/TestLog.py
index 7093026..dc55c2b 100644
--- a/test/TestLog.py
+++ b/test/TestLog.py
@@ -11,7 +11,7 @@
 import unittest
 import os
 import sys
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestParseAll.py b/test/TestParseAll.py
index c398b01..d004f61 100644
--- a/test/TestParseAll.py
+++ b/test/TestParseAll.py
@@ -17,33 +17,18 @@
 from lxml import etree
 import logging
 import os
-import redi
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
 class TestParseAll(unittest.TestCase):
 
     def setUp(self):
-        global logger
-        logger = logging.getLogger('redi')
-        logging.basicConfig(filename=DEFAULT_DATA_DIRECTORY,
-                        format='%(asctime)s - %(levelname)s - \
-                        %(name)s - %(message)s',
-                        datefmt='%m/%d/%Y %H:%M:%S',
-                        filemode='w',
-                        level=logging.DEBUG)
-        return()
+        redi.configure_logging(DEFAULT_DATA_DIRECTORY)
 
     ############################
     # == TEST_1 - config/formEvents.xml
     def test_parse_form_events(self):
-        redi.configure_logging(DEFAULT_DATA_DIRECTORY)
-        logger.info("Running " + __name__ 
-            + "#test_person_form_event() using xml: " )
         string_1_xml = """<?xml version="1.0" encoding="UTF-8"?>
 <redcapProject>
 	<name>Project</name>
diff --git a/test/TestParseRawXml.py b/test/TestParseRawXml.py
index 2e9c766..fb40d70 100644
--- a/test/TestParseRawXml.py
+++ b/test/TestParseRawXml.py
@@ -8,7 +8,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestParseTranslationTable.py b/test/TestParseTranslationTable.py
index feaa353..83c33a4 100644
--- a/test/TestParseTranslationTable.py
+++ b/test/TestParseTranslationTable.py
@@ -8,7 +8,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestPersonFormEventsRepository.py b/test/TestPersonFormEventsRepository.py
index b59fdc5..850d8c4 100644
--- a/test/TestPersonFormEventsRepository.py
+++ b/test/TestPersonFormEventsRepository.py
@@ -3,7 +3,7 @@
 
 from lxml import etree
 
-from bin.redi import PersonFormEventsRepository
+from redi.redi import PersonFormEventsRepository
 
 
 class TestPersonFormEventsRepository(unittest.TestCase):
diff --git a/test/TestReadConfig.py b/test/TestReadConfig.py
index a03e4c4..9e64dc2 100644
--- a/test/TestReadConfig.py
+++ b/test/TestReadConfig.py
@@ -3,8 +3,8 @@
 import shutil
 import os
 
-from bin import redi
-from bin.utils import SimpleConfigParser
+from redi import redi
+from redi.utils import SimpleConfigParser
 
 class TestReadConfig(unittest.TestCase):
 
diff --git a/test/TestRediEmail.py b/test/TestRediEmail.py
index b106a8d..dc1e40f 100644
--- a/test/TestRediEmail.py
+++ b/test/TestRediEmail.py
@@ -1,15 +1,16 @@
 import unittest
 import smtplib
 from mock import patch, call
-import redi
-from utils import redi_email
+from redi import redi
+from redi.utils.rawxml import RawXml
+from redi.utils import redi_email
 
 
 class TestRediEmail(unittest.TestCase):
     """
     Check functions in the `utils/redi_email` module
     To run individually:
-        $ PYTHONPATH=bin python test/TestRediEmail.py
+        $ PYTHONPATH=redi python test/TestRediEmail.py
     """
 
     def setUp(self):
@@ -26,6 +27,8 @@ def setUp(self):
             }
         self.settings = type("", (), settings)()
         self.email_settings = redi.get_email_settings(self.settings)
+        self.raw_xml = RawXml('', __file__)
+
 
     def test_get_email_settings(self):
         """Check if we picked proper values from the global settings"""
@@ -57,14 +60,14 @@ def test_success(self):
         """ Verify return true when email is sent"""
         ese = self.email_settings
         self.assertTrue(redi_email.send_email_redcap_connection_error(ese))
-        self.assertTrue(redi_email.send_email_input_data_unchanged(ese))
+        self.assertTrue(redi_email.send_email_input_data_unchanged(ese, self.raw_xml))
 
     @patch.multiple(redi_email, send_email=dummy_send_failed)
     def test_failed(self):
         """ Verify return false when email is not sent"""
         ese = self.email_settings
         self.assertFalse(redi_email.send_email_redcap_connection_error(ese))
-        self.assertFalse(redi_email.send_email_input_data_unchanged(ese))
+        self.assertFalse(redi_email.send_email_input_data_unchanged(ese, self.raw_xml))
 
     @patch("smtplib.SMTP")
     def test_mime_email(self, mock_smtp):
@@ -82,7 +85,8 @@ def test_mime_email_exception(self, mock_smtp):
         ese = self.email_settings
         instance = mock_smtp.return_value
         instance.sendmail.side_effect = smtplib.SMTPRecipientsRefused({})
-        self.assertRaises(smtplib.SMTPRecipientsRefused, redi_email.send_email_data_import_completed, ese)
+        self.assertRaises(smtplib.SMTPRecipientsRefused,\
+                redi_email.send_email_data_import_completed, ese)
         self.assertEqual(instance.sendmail.call_count, 1)
 
     def tearDown(self):
diff --git a/test/TestResearchIdToRedcapId.py b/test/TestResearchIdToRedcapId.py
index be0cd93..6af20ae 100644
--- a/test/TestResearchIdToRedcapId.py
+++ b/test/TestResearchIdToRedcapId.py
@@ -3,10 +3,10 @@
 import os
 from lxml import etree
 from mock import patch
-import redi
-from utils import redi_email
-from utils.redcapClient import RedcapClient
-import utils.SimpleConfigParser as SimpleConfigParser
+from redi import redi
+from redi.utils import redi_email
+from redi.utils.redcapClient import RedcapClient
+from redi.utils import SimpleConfigParser
 from requests import RequestException
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
@@ -19,7 +19,7 @@ class TestResearchIdToRedcapId(unittest.TestCase):
 
     def setUp(self):
         self.sortedData = """
-    <study>
+<study>
     <subject>
         <NAME>HEMOGLOBIN</NAME>
         <loinc_code>1534435</loinc_code>
@@ -28,8 +28,9 @@ def setUp(self):
         <REFERENCE_HIGH>16.0</REFERENCE_HIGH>
         <REFERENCE_UNIT>g/dL</REFERENCE_UNIT>
         <DATE_TIME_STAMP/>
-        <STUDY_ID>999-0059</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus></subject>
+        <STUDY_ID>999-0001</STUDY_ID>
+    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus>
+    </subject>
     <subject>
         <NAME>WBC</NAME>
         <loinc_code>999</loinc_code>
@@ -38,39 +39,19 @@ def setUp(self):
         <REFERENCE_HIGH/>
         <REFERENCE_UNIT/>
         <DATE_TIME_STAMP/>
-        <STUDY_ID>999-0059</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>wbc_lborres</redcapFieldNameValue><redcapFieldNameUnits>wbc_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>wbc_lbstat</redcapFieldNameStatus></subject>
-    <subject>
-        <NAME>PLATELET COUNT</NAME>
-        <loinc_code>1009</loinc_code>
-        <RESULT>92</RESULT>
-        <REFERENCE_LOW/>
-        <REFERENCE_HIGH/>
-        <REFERENCE_UNIT/>
-        <DATE_TIME_STAMP/>
-        <STUDY_ID>999-0059</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>plat_lborres</redcapFieldNameValue><redcapFieldNameUnits>plat_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>plat_lbstat</redcapFieldNameStatus></subject>
-    <subject>
-        <NAME>HEMOGLOBIN</NAME>
-        <loinc_code>1534435</loinc_code>
-        <RESULT>9.5</RESULT>
-        <REFERENCE_LOW>12.0</REFERENCE_LOW>
-        <REFERENCE_HIGH>16.0</REFERENCE_HIGH>
-        <REFERENCE_UNIT>g/dL</REFERENCE_UNIT>
-        <DATE_TIME_STAMP/>
-        <STUDY_ID>999-0059</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus></subject>
-    </study>"""
+        <STUDY_ID>999-0002</STUDY_ID>
+    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>wbc_lborres</redcapFieldNameValue><redcapFieldNameUnits>wbc_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>wbc_lbstat</redcapFieldNameStatus>
+    </subject>
+</study>"""
 
         self.data = etree.ElementTree(etree.fromstring(self.sortedData))
-        self.serverResponse = """<records>
-    <item><dm_subjid><![CDATA[3]]></dm_subjid><redcap_event_name><![CDATA[1_arm_1]]></redcap_event_name><dm_usubjid><![CDATA[999-0001]]></dm_usubjid></item>
+        self.serverResponse = """
+<records>
 <item><dm_subjid><![CDATA[76]]></dm_subjid><redcap_event_name><![CDATA[1_arm_1]]></redcap_event_name><dm_usubjid><![CDATA[999-0059]]></dm_usubjid></item>
-<item><dm_subjid><![CDATA[5]]></dm_subjid><redcap_event_name><![CDATA[1_arm_1]]></redcap_event_name><dm_usubjid><![CDATA[001-0005]]></dm_usubjid></item></records>"""
-
+</records>"""
 
         self.output = """<study>
-    <subject>
+    <subject lab_id="999-0001">
         <NAME>HEMOGLOBIN</NAME>
         <loinc_code>1534435</loinc_code>
         <RESULT>10.5</RESULT>
@@ -79,8 +60,9 @@ def setUp(self):
         <REFERENCE_UNIT>g/dL</REFERENCE_UNIT>
         <DATE_TIME_STAMP/>
         <STUDY_ID>1</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus></subject>
-    <subject>
+    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus>
+    </subject>
+    <subject lab_id="999-0002">
         <NAME>WBC</NAME>
         <loinc_code>999</loinc_code>
         <RESULT>5.4</RESULT>
@@ -88,38 +70,20 @@ def setUp(self):
         <REFERENCE_HIGH/>
         <REFERENCE_UNIT/>
         <DATE_TIME_STAMP/>
-        <STUDY_ID>1</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>wbc_lborres</redcapFieldNameValue><redcapFieldNameUnits>wbc_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>wbc_lbstat</redcapFieldNameStatus></subject>
-    <subject>
-        <NAME>PLATELET COUNT</NAME>
-        <loinc_code>1009</loinc_code>
-        <RESULT>92</RESULT>
-        <REFERENCE_LOW/>
-        <REFERENCE_HIGH/>
-        <REFERENCE_UNIT/>
-        <DATE_TIME_STAMP/>
-        <STUDY_ID>1</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>plat_lborres</redcapFieldNameValue><redcapFieldNameUnits>plat_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>plat_lbstat</redcapFieldNameStatus></subject>
-    <subject>
-        <NAME>HEMOGLOBIN</NAME>
-        <loinc_code>1534435</loinc_code>
-        <RESULT>9.5</RESULT>
-        <REFERENCE_LOW>12.0</REFERENCE_LOW>
-        <REFERENCE_HIGH>16.0</REFERENCE_HIGH>
-        <REFERENCE_UNIT>g/dL</REFERENCE_UNIT>
-        <DATE_TIME_STAMP/>
-        <STUDY_ID>1</STUDY_ID>
-    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>hemo_lborres</redcapFieldNameValue><redcapFieldNameUnits>hemo_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>hemo_lbstat</redcapFieldNameStatus></subject>
-    </study>"""
+        <STUDY_ID>2</STUDY_ID>
+    <timestamp/><redcapFormName>cbc</redcapFormName><eventName/><formDateField>cbc_lbdtc</formDateField><formCompletedFieldName>cbc_complete</formCompletedFieldName><formImportedFieldName>cbc_nximport</formImportedFieldName><redcapFieldNameValue>wbc_lborres</redcapFieldNameValue><redcapFieldNameUnits>wbc_lborresu</redcapFieldNameUnits><redcapFieldNameStatus>wbc_lbstat</redcapFieldNameStatus>
+    </subject>
+</study>"""
 
         self.expect = etree.tostring(etree.fromstring(self.output))
         self.configuration_directory = tempfile.mkdtemp('/')
         self.research_id_to_redcap_id = "research_id_to_redcap_id_map.xml"
         try:
             f = open(os.path.join(self.configuration_directory, self.research_id_to_redcap_id), "w+")
-            f.write("""<subject_id_field_mapping>
-  <redcap_id_field_name>dm_subjid</redcap_id_field_name>
-  <research_id_field_name>dm_usubjid</research_id_field_name>
+            f.write("""
+<subject_id_field_mapping>
+    <redcap_id_field_name>dm_subjid</redcap_id_field_name>
+    <research_id_field_name>dm_usubjid</research_id_field_name>
 </subject_id_field_mapping>""")
             f.close()
         except:
@@ -131,7 +95,16 @@ def dummy_redcapClient_initializer(self, redcap_uri, token, verify_ssl):
     def dummy_get_data_from_redcap(self,records_to_fecth=[],events_to_fetch=[], fields_to_fetch=[], forms_to_fetch=[], return_format='xml'):
         dummy_output = """<?xml version="1.0" encoding="UTF-8" ?>
 <records>
-<item><dm_subjid><![CDATA[1]]></dm_subjid><redcap_event_name><![CDATA[1]]></redcap_event_name><dm_usubjid><![CDATA[999-0059]]></dm_usubjid></item>
+    <item>
+        <dm_subjid><![CDATA[1]]></dm_subjid>
+        <redcap_event_name><![CDATA[1]]></redcap_event_name>
+        <dm_usubjid><![CDATA[999-0001]]></dm_usubjid>
+    </item>
+    <item>
+        <dm_subjid><![CDATA[2]]></dm_subjid>
+        <redcap_event_name><![CDATA[1]]></redcap_event_name>
+        <dm_usubjid><![CDATA[999-0002]]></dm_usubjid>
+    </item>
 </records>"""
         return dummy_output
 
diff --git a/test/TestResume.py b/test/TestResume.py
index 491008c..df255c5 100644
--- a/test/TestResume.py
+++ b/test/TestResume.py
@@ -14,8 +14,8 @@ def delete(self):
         class FileDeleted():
             pass
 
-        import bin.redi
-        redi = reload(bin.redi)
+        import redi.redi
+        redi = reload(redi.redi)
 
         redi._person_form_events_service = MockPersonFormEvents()
         redi._check_input_file = lambda *args: None
@@ -24,7 +24,8 @@ class FileDeleted():
             redi._run(config_file=None, configuration_directory='',
                       do_keep_gen_files=None, dry_run=True, get_emr_data=False,
                       settings=MockSettings(), data_folder=None,
-                      database_path=None, redcap_client=None)
+                      database_path=None, redcap_client=None,
+                      report_courier=None, report_creator=None)
 
     def test_no_resume_stores(self):
         class MockPersonFormEvents(object):
@@ -37,8 +38,8 @@ def store(self, ignored):
         class FileStored():
             pass
 
-        import bin.redi
-        redi = reload(bin.redi)
+        import redi.redi
+        redi = reload(redi.redi)
 
         redi._person_form_events_service = MockPersonFormEvents()
         redi._check_input_file = lambda *args: None
@@ -52,7 +53,8 @@ class FileStored():
             redi._run(config_file=None, configuration_directory='',
                       do_keep_gen_files=None, dry_run=True, get_emr_data=False,
                       settings=MockSettings(), data_folder=None,
-                      database_path=None, redcap_client=None)
+                      database_path=None, redcap_client=None,
+                      report_courier=None, report_creator=None)
 
     def test_resume_fetches_data_from_last_run(self):
         class MockPersonFormEvents(object):
@@ -62,8 +64,8 @@ def fetch(self):
         class DataFetched():
             pass
 
-        import bin.redi
-        redi = reload(bin.redi)
+        import redi.redi
+        redi = reload(redi.redi)
 
         redi._person_form_events_service = MockPersonFormEvents()
         redi._check_input_file = lambda *args: None
@@ -72,7 +74,8 @@ class DataFetched():
             redi._run(config_file=None, configuration_directory='',
                       do_keep_gen_files=None, dry_run=True, get_emr_data=False,
                       settings=MockSettings(), data_folder=None,
-                      database_path=None, resume=True, redcap_client=None)
+                      database_path=None, resume=True, redcap_client=None,
+                      report_courier=None, report_creator=None)
 
 
 class MockSettings(object):
diff --git a/test/TestSendDatatoRedcap.py b/test/TestSendDatatoRedcap.py
index 730ed19..9cec4f7 100644
--- a/test/TestSendDatatoRedcap.py
+++ b/test/TestSendDatatoRedcap.py
@@ -9,7 +9,7 @@
 import unittest
 import os
 from wsgiref.simple_server import make_server
-import redi
+from redi import redi
 import thread
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
diff --git a/test/TestSentEventIndex.py b/test/TestSentEventIndex.py
new file mode 100644
index 0000000..df2b3e2
--- /dev/null
+++ b/test/TestSentEventIndex.py
@@ -0,0 +1,44 @@
+"""
+Verifies the functionality of bin.redi.SentEventIndex
+"""
+import unittest
+
+from redi import redi
+
+
+class TestSentEventIndex(unittest.TestCase):
+
+    def test_len(self):
+        index = redi.SentEvents("", writer=lambda o, f: None,
+                                    reader=lambda f: [])
+        self.assertEqual(0, len(index))
+
+        index.mark_sent("007", "new_hire", "1_arm_1")
+        index.mark_sent("007", "new_hire", "2_arm_1")
+
+        self.assertEqual(2, len(index))
+
+    def test_was_sent(self):
+        index = redi.SentEvents("", writer=lambda o, f: None,
+                                    reader=lambda f: [])
+
+        index.mark_sent("007", "new_hire", "1_arm_1")
+
+        self.assertTrue(index.was_sent("007", "new_hire", "1_arm_1"))
+
+    def test_mark_sent(self):
+        self.__tally = 0
+
+        index = redi.SentEvents("", self.__dummy_writer,
+                                    reader=lambda f: [])
+        index.mark_sent("007", "new_hire", "1_arm_1")
+        index.mark_sent("007", "new_hire", "2_arm_1")
+
+        self.assertEqual(2, self.__tally)
+
+    def __dummy_writer(self, obj, filename):
+        self.__tally += 1
+
+
+if __name__ == "__main__":
+    unittest.main()
diff --git a/test/TestSortElementTree.py b/test/TestSortElementTree.py
index cf31106..7508ea2 100644
--- a/test/TestSortElementTree.py
+++ b/test/TestSortElementTree.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestSuite.py b/test/TestSuite.py
index eb86b04..cd296d6 100755
--- a/test/TestSuite.py
+++ b/test/TestSuite.py
@@ -38,9 +38,11 @@
 from TestCopyDataToPersonFormEventTree import TestCopyDataToPersonFormEventTree
 from TestGetEMRData import TestGetEMRData
 from TestResume import TestResume
+from TestThrottle import TestThrottle
 from TestPersonFormEventsRepository import TestPersonFormEventsRepository
 from TestVerifyAndCorrectCollectionDate import TestVerifyAndCorrectCollectionDate
 from TestRediEmail import TestRediEmail
+from TestSentEventIndex import TestSentEventIndex
 
 class redi_suite(unittest.TestSuite):
 
@@ -68,6 +70,7 @@ def suite(self):
         redi_test_suite.addTest(TestCreateEmptyEventTreeForStudy)
         redi_test_suite.addTest(TestVerifyAndCorrectCollectionDate)
         redi_test_suite.addTest(TestParseAll)
+        redi_test_suite.addTest(TestSentEventIndex)
 
         # The redesign functions May 2014
         redi_test_suite.addTest(TestCreateImportDataJson)
@@ -79,8 +82,10 @@ def suite(self):
         redi_test_suite.addTest(TestCopyDataToPersonFormEventTree)
         redi_test_suite.addTest(TestGetEMRData)
         redi_test_suite.addTest(TestResume)
+        redi_test_suite.addTest(TestThrottle)
         redi_test_suite.addTest(TestPersonFormEventsRepository)
         redi_test_suite.addTest(TestRediEmail)
+        redi_test_suite.addTest(TestDaysSinceToday)
 
         # return the suite
         return unittest.TestSuite([redi_test_suite])
diff --git a/test/TestThrottle.py b/test/TestThrottle.py
new file mode 100644
index 0000000..a816b51
--- /dev/null
+++ b/test/TestThrottle.py
@@ -0,0 +1,43 @@
+#!/usr/bin/env python
+
+import datetime
+import unittest
+
+from redi.utils import throttle
+
+
+class TestThrottle(unittest.TestCase):
+
+    def test_throttle(self):
+        class Clock(object):
+            def __init__(self):
+                self.now = datetime.datetime.now()
+
+            def __call__(self):
+                return self.now
+
+            def add_seconds(self, seconds):
+                self.now += datetime.timedelta(seconds=seconds)
+
+        clock = Clock()
+        throttle.Throttle._now = clock
+        throttle.Throttle._sleep = clock.add_seconds
+
+        call = throttle.Throttle(lambda: None, max_calls=3,
+                                 interval_in_seconds=5)
+
+        call()  # t=0
+        clock.add_seconds(1)
+        call()  # t=1
+        clock.add_seconds(2)
+        call()  # t=3
+        clock.add_seconds(1)
+        call()  # t=4
+        self.assertEquals(1, len(call._timestamps))
+        clock.add_seconds(1)
+        call()  # t=5
+        self.assertEquals(2, len(call._timestamps))
+
+
+if __name__ == '__main__':
+    unittest.main()
diff --git a/test/TestUpdateDataFromLookup.py b/test/TestUpdateDataFromLookup.py
index 477daf9..fccef21 100644
--- a/test/TestUpdateDataFromLookup.py
+++ b/test/TestUpdateDataFromLookup.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateEventName.py b/test/TestUpdateEventName.py
index 1114218..1f3fff5 100644
--- a/test/TestUpdateEventName.py
+++ b/test/TestUpdateEventName.py
@@ -1,7 +1,7 @@
 import unittest
 from lxml import etree
 import os
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateFormCompletedFieldName.py b/test/TestUpdateFormCompletedFieldName.py
index a32998c..4f9af79 100644
--- a/test/TestUpdateFormCompletedFieldName.py
+++ b/test/TestUpdateFormCompletedFieldName.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateFormDateField.py b/test/TestUpdateFormDateField.py
index 3792776..c2f6957 100644
--- a/test/TestUpdateFormDateField.py
+++ b/test/TestUpdateFormDateField.py
@@ -9,7 +9,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateFormImported.py b/test/TestUpdateFormImported.py
index 3d335ec..e97abeb 100644
--- a/test/TestUpdateFormImported.py
+++ b/test/TestUpdateFormImported.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateRedcapFieldNameValueAndUnits.py b/test/TestUpdateRedcapFieldNameValueAndUnits.py
index 9e05a2e..a71330d 100644
--- a/test/TestUpdateRedcapFieldNameValueAndUnits.py
+++ b/test/TestUpdateRedcapFieldNameValueAndUnits.py
@@ -1,7 +1,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestUpdateRedcapForm.py b/test/TestUpdateRedcapForm.py
index e8b4642..56e7b8e 100644
--- a/test/TestUpdateRedcapForm.py
+++ b/test/TestUpdateRedcapForm.py
@@ -1,6 +1,6 @@
 import unittest
 from lxml import etree
-import redi
+from redi import redi
 
 
 class TestUpdateRedcapForm(unittest.TestCase):
diff --git a/test/TestUpdateStatusField.py b/test/TestUpdateStatusField.py
index cab6a94..0e0a010 100644
--- a/test/TestUpdateStatusField.py
+++ b/test/TestUpdateStatusField.py
@@ -1,18 +1,18 @@
 import unittest
 from lxml import etree
 import os
-import redi
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
 class TestUpdateStatusField(unittest.TestCase):
 
-  def test_update_status_field_value_when_one_subject_with_two_forms_with_one_event_in_each_form(self):
+  def setUp(self):
     redi.configure_logging(DEFAULT_DATA_DIRECTORY)
+
+
+  def test_update_status_field_value_when_one_subject_with_two_forms_with_one_event_in_each_form(self):
+
     self.source = """<person_form_event>
       <person>
           <study_id>99</study_id>
@@ -153,7 +153,6 @@ def test_update_status_field_value_when_one_subject_with_two_forms_with_one_even
     self.assertEqual(self.expect, result)
 
   def test_update_status_field_value_when_one_subject_with_two_forms_with_two_events_in_each_form(self):
-    redi.configure_logging(proj_root+'log/redi.log')
     self.source = """<person_form_event>
       <person>
           <study_id>99</study_id>
@@ -370,7 +369,6 @@ def test_update_status_field_value_when_one_subject_with_two_forms_with_two_even
     self.assertEqual(self.expect, result)
 
   def test_update_status_field_value_when_two_subjects_with_two_forms_with_one_event_in_each_form(self):
-    redi.configure_logging(proj_root+'log/redi.log')
     self.source = """<person_form_event>
           <person>
               <study_id>99</study_id>
@@ -609,7 +607,6 @@ def test_update_status_field_value_when_two_subjects_with_two_forms_with_one_eve
     self.assertEqual(self.expect, result)
 
   def test_update_status_field_value_when_one_subject_with_no_form(self):
-    redi.configure_logging(proj_root+'log/redi.log')
     self.source = """<person_form_event>
           <person>
               <study_id>99</study_id>
@@ -662,7 +659,6 @@ def test_update_status_field_value_when_one_subject_with_no_form(self):
     self.assertEqual(self.expect, result)
 
   def test_update_status_field_value_when_one_subject_with_two_forms_event_missing_in_one_of_the_forms(self):
-    redi.configure_logging(proj_root+'log/redi.log')
     self.source = """<person_form_event>
           <person>
               <study_id>99</study_id>
@@ -757,7 +753,6 @@ def test_update_status_field_value_when_one_subject_with_two_forms_event_missing
     self.assertEqual(self.expect, result)
 
   def test_update_status_field_value_when_one_subject_with_one_form_one_event_value_tag_missing(self):
-    redi.configure_logging(proj_root+'log/redi.log')
     self.source = """<person_form_event>
           <person>
               <study_id>99</study_id>
diff --git a/test/TestUpdateTimestamp.py b/test/TestUpdateTimestamp.py
index d68c44d..aa0ecfd 100644
--- a/test/TestUpdateTimestamp.py
+++ b/test/TestUpdateTimestamp.py
@@ -12,7 +12,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestValidateXmlFleAndExtractData.py b/test/TestValidateXmlFleAndExtractData.py
index d50b161..a9d6aea 100644
--- a/test/TestValidateXmlFleAndExtractData.py
+++ b/test/TestValidateXmlFleAndExtractData.py
@@ -8,7 +8,7 @@
 import unittest
 import os
 from lxml import etree
-import redi
+from redi import redi
 
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
diff --git a/test/TestVerifyAndCorrectCollectionDate.py b/test/TestVerifyAndCorrectCollectionDate.py
index c7b7777..1ff67b9 100644
--- a/test/TestVerifyAndCorrectCollectionDate.py
+++ b/test/TestVerifyAndCorrectCollectionDate.py
@@ -11,9 +11,9 @@
 file_dir = os.path.dirname(os.path.realpath(__file__))
 goal_dir = os.path.join(file_dir, "../")
 proj_root = os.path.abspath(goal_dir)+'/'
-sys.path.append(proj_root + 'bin/')
+sys.path.append(proj_root + 'redi/')
 from lxml import etree
-import redi
+from redi import redi
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
diff --git a/test/TestWriteToFile.py b/test/TestWriteToFile.py
index 32d5a74..57fd929 100755
--- a/test/TestWriteToFile.py
+++ b/test/TestWriteToFile.py
@@ -1,23 +1,13 @@
-'''
-@author : Radha
-email : rkandula@ufl.edu
-
-This file is to test the function writeElementTreetoFile of bin/redi.py
-This file should be run from the project level folder (one level up from /bin)
-
-'''
 import unittest
 import os
 from lxml import etree
-import redi
-
-file_dir = os.path.dirname(os.path.realpath(__file__))
-goal_dir = os.path.join(file_dir, "../")
-proj_root = os.path.abspath(goal_dir)+'/'
+from redi import redi
 
 DEFAULT_DATA_DIRECTORY = os.getcwd()
 
 class TestWriteToFile(unittest.TestCase):
+
+    """ Variables setup """
     def setUp(self):
         redi.configure_logging(DEFAULT_DATA_DIRECTORY)
         self.test_raw_xml = """<?xml version='1.0' encoding='US-ASCII'?>
@@ -36,32 +26,16 @@ def setUp(self):
         <Reference_High>5.0</Reference_High>
         <Result_Value>3.9</Result_Value>
     </subject>
-    <subject>
-        <Study_Id>001-0001</Study_Id>
-        <Study_Start>09/11/18</Study_Start>
-        <Collection_Date>04/18/19</Collection_Date>
-        <Collection_Time>11:57</Collection_Time>
-        <Qualifying_Result>Y</Qualifying_Result>
-        <Study_Stop>04/14/20</Study_Stop>
-        <Component_Name>ALKALINE PHOSPHATASE</Component_Name>
-        <loinc_code>1525848</loinc_code>
-        <Reference_Unit>U/L</Reference_Unit>
-        <Reference_Low>35</Reference_Low>
-        <Reference_High>129</Reference_High>
-        <Result_Value>112</Result_Value>
-    </subject>
 </study>
 """
 
-    '''  '''
-
-    # this is a function to test the writeElementTreetoFile function.
-    # we called it with input file and tried to write the element tree to an XML file
-    def testWriteElementTreetoFile(self):
-        import xml.etree.ElementTree as ET
+    def test_write_element_tree_to_file(self):
+        """ Test the correctness of function
+        redi.write_element_tree_to_file()
+        """
         tree = etree.ElementTree(etree.fromstring(self.test_raw_xml))
         root = tree.getroot()
-        redi.write_element_tree_to_file(tree,'testWriteFile.xml')
+        redi.write_element_tree_to_file(tree, 'testWriteFile.xml')
         assert os.path.exists('testWriteFile.xml') == 1
         os.remove('testWriteFile.xml')
 
diff --git a/vagrant/Makefile b/vagrant/Makefile
index d892098..5747bb3 100644
--- a/vagrant/Makefile
+++ b/vagrant/Makefile
@@ -19,7 +19,7 @@ ifneq ("$(wildcard $(MAKE_CONFIG_FILE))", "")
    REDCAP_API_URI := $(shell cat ${CONFIG_FILE} | sed -e 's/ //g' | grep -v '^\#' | grep 'redcap_uri=' | cut -d '=' -f2)
    REDCAP_VM_URI := $(subst api/,,$(REDCAP_API_URI))
    REDCAP_VM_TOKEN := $(shell cat ${CONFIG_FILE} | sed -e 's/ //g' | grep -v '^\#' | grep 'token=' | cut -d '=' -f2)
-   REDCAP_RECORDS_CMD:=../bin/utils/redcap_records.py --token=$(REDCAP_VM_TOKEN) --url=$(REDCAP_API_URI)
+   REDCAP_RECORDS_CMD:=../redi/utils/redcap_records.py --token=$(REDCAP_VM_TOKEN) --url=$(REDCAP_API_URI)
    REDCAP_PROJECT_ID := $(shell cat ${MAKE_CONFIG_FILE} | sed -e 's/ //g' | grep -v '^\#' | grep 'redcap_project_id=' | cut -d '=' -f2)
    REDCAP_PROJECT_FORMS := $(shell cat ${MAKE_CONFIG_FILE} | sed -e 's/ //g' | grep -v '^\#' | grep 'redcap_project_forms=' | cut -d '=' -f2)
    REDCAP_PROJECT_ENROLLMENT_FORM := $(shell cat ${MAKE_CONFIG_FILE} | sed -e 's/ //g' | grep -v '^\#' | grep 'redcap_project_enrollment_form=' | cut -d '=' -f2)
@@ -114,7 +114,7 @@ rc_enrollment: check_config
 	$(REDCAP_RECORDS_CMD) -i $(ENROLLMENT_CSV_FILE)
 
 rc_post:
-	python ../bin/redi.py -c $(CONFIG_FOLDER)
+	python ../redi/redi.py -c $(CONFIG_FOLDER)
 
 rc_get: check_config
 	$(REDCAP_RECORDS_CMD) -f "$(REDCAP_PROJECT_FORMS)"
@@ -125,6 +125,9 @@ rc_get_json: check_config
 rc_get_enrollment: check_config
 	$(REDCAP_RECORDS_CMD) -f "$(REDCAP_PROJECT_ENROLLMENT_FORM)" -t csv
 
+rc_get_enrollment_meta:
+	@curl -X POST http://localhost:8998/redcap/api/ -d token=$(REDCAP_VM_TOKEN) -d content=metadata -d format=csv -d forms[]=enrollment
+
 rc_fresh:
 	make copy_project_data
 	make rc_clean
diff --git a/vagrant/README.md b/vagrant/README.md
deleted file mode 100644
index 54fec6b..0000000
--- a/vagrant/README.md
+++ /dev/null
@@ -1,105 +0,0 @@
-# Testing RED-I with a sample REDCap Project
-
-## Purpose
-
-The "vagrant" folder was created with the goal of making testing [RED-I software](https://github.com/ctsit/redi) as easy as possible.
-It contains the [Vagrantfile](../vagrant/Vagrantfile) which allows to start a virtual machine capable of running the
-[REDCap software](http://http://www.project-redcap.org) -- which means that during virtual machine creation the Apache and MySQL
-software is installed without any user intervention.
-
-There are a few important things to note before proceeding with running RED-I to import data into a sample REDCap project:
-
-- You have to install the **vagrant** and **virtual box** software
-- You have to obtain the closed-source REDCap software from http://project-redcap.org/
-- You have to obtain a **Makefile.ini** file in order to be able to execute tasks from the **Makefile**
-
-## Steps
-
-### 1. Install vagrant and virtual box
-
-On a linux machine run:
-
-* sudo apt-get install vagrant
-* sudo apt-get install virtualbox
-
-
-On a mac machine:
-
-* Download and install vagrant from https://www.vagrantup.com/downloads.html
-* Download and install the latest virtual box from http://download.virtualbox.org/virtualbox/
-
-For more details about Vagrant software you can go to [why-vagrant](https://docs.vagrantup.com/v2/why-vagrant/) page.
-
-
-### 2. Configure the VM
-
-As mentioned above you have to obtain a copy of the REDCap software from http://project-redcap.org/
-and save it as "**redcap.zip**" file in the "**config-example/vagrant-data**" folder.
-This ensures that in the later steps the [bootstrap.sh](../vagrant/bootstrap.sh) script can extract the files to the
-virtual machine path "**/var/www/redcap**".
-
-Now execute the following commands to complete the configuration:
-
-<pre>
-make copy_config_example
-make copy_redcap_code
-make copy_project_data
-make show_config
-</pre>
-
-Please verify that the output from "show_config" matheches your expectations.
-
-### 3. Start the VM
-
-To use the vagrant VM you will need to install Vagrant and Virtual Box.
-
-With these packages installed, follow this procedure to use a VM template:
-
-    cd ./vagrant
-    vagrant up
-
-Vagrant will instantiate and provision the new VM.  The REDCap web application should be accessible in the browser at
-
-   http://localhost:8998/redcap/
-
-If port 8998 is already in use vagrant will choose a different port automatically.
-Read the log of "vagrant up" and note the port to be used.
-
-### 4. Verify the VM is running
-
-Verify that the virtual machine is working properly by accessing it using:
-
-<pre>
-vagrant ssh
-</pre>
-
-### 5. Import Enrollment Data using RED-I
-
-Import the [sample subject list](../config-example/vagrant-data/enrollment_test_data.csv) into REDCap by executing:
-
-<pre>
-make rc_enrollment
-</pre>
-
-Note: This step is necessary because in order to associate data with subjects the list of subjects needs to exist in the REDCap database.
-
-
-### 6. Import Electronic Health Records using RED-I
-
-Import the [sample electronic health records](../config-example/vagrant-data/redi_sample_project_v5.7.4.sql) into REDCap by executing:
-
-<pre>
-make rc_post
-</pre>
-
-Verify that the output of this command ends with:
-<pre>
-You can review the summary report by opening: report.html in your browser
-</pre>
-
-If this step succeded you have verified that RED-I can be used to save time by automating EHR data imports into REDCap.
-
-<span style="color: green; font-weight: bold">
-Congratulations! You can now [add your own REDCap project](../doc/add_new_redcap_project.md)
-and start using RED-I to move data.
-</span>
diff --git a/vagrant/aliases b/vagrant/aliases
index d7a53d6..1339306 100644
--- a/vagrant/aliases
+++ b/vagrant/aliases
@@ -1,4 +1,45 @@
 alias db='mysql --prompt="(\u@\h) [\d]> " --pager="less -niSFX" -uroot -ppassword redcap'
 alias check_redcap="curl -s http://localhost/redcap/ | grep -i  'Welcome\|Critical Error' "
 alias restart_httpd='sudo /etc/init.d/apache2 reload '
-alias lsa='ls -al --color=auto'
+alias restart_mysql='sudo service mysql restart'
+
+alias cdapi='cd /var/www/redcap/redcap_v5.7.4/API && pwd && ls -al'
+alias ls='ls --color=auto'
+alias lsa='ls -al'
+alias lss='ls -ltr'
+alias dua='du -hcs'
+alias cdd='cd ..'
+
+alias gst='git status'
+alias glog='git log'
+alias gdiff='git diff'
+alias gdif='git diff --cached'
+alias gb='git branch'
+alias gp='git remote -v'
+alias gf='git show --name-status'
+
+alias gan='git blame'
+alias gin='git fetch && git log ..origin/master'
+alias gout='git fetch && git log origin/master..'
+
+alias grepp="nice ack-grep --php --python -i"
+
+function venv() {
+   CMD="X$1"
+
+   if [ "$CMD" = "Xup" ]; then
+      . venv/bin/activate
+   elif [ "$CMD" = "Xdown" ]; then
+      deactivate
+   elif [ "$CMD" = "Xrestart" ]; then
+      rm -rf venv
+      virtualenv venv
+      . venv/bin/activate
+      which redi
+   elif [ "$CMD" = "Xdestroy" ]; then
+      deactivate
+      rm -rf venv
+   else
+      echo "Supported commands: venv [up | down | restart | destroy]"
+   fi
+}
diff --git a/vagrant/downloading_redcap_code.rst b/vagrant/downloading_redcap_code.rst
new file mode 100644
index 0000000..2ba2414
--- /dev/null
+++ b/vagrant/downloading_redcap_code.rst
@@ -0,0 +1,17 @@
+Downloading REDCap Source Code
+==============================
+
+REDCap code is available only through Vanderbilt University.
+
+Possession and use of REDCap code and workflow methodology is strictly
+limited to institutions and organizations who have finalized an End-User
+License Agreement with Vanderbilt University.
+
+https://redcap.vanderbilt.edu/consortium/
+
+Long Term Support URLs
+----------------------
+
+* https://iwg.devguard.com/trac/redcap/browser/zips_redcap/6.0.5/redcap6.0.5.zip
+* https://iwg.devguard.com/trac/redcap/browser/zips_redcap/6.0.5/redcap6.0.5_upgrade.zip
+