From 581bcf0fd57f81c9c82f3b3116191cb83b6e63df Mon Sep 17 00:00:00 2001
From: SOCIALSCIENCEai <nick.sh.oh@socialscience.ai>
Date: Tue, 16 Apr 2024 00:11:05 +0100
Subject: [PATCH] Update documentation

---
 .buildinfo                                    |   2 +-
 _sources/{Introduction.md => about.md}        |   2 +-
 _sources/data_schema/comment.md               |  23 +
 _sources/data_schema/submission.md            |  37 ++
 _sources/data_schema/user.md                  |  29 +
 .../installation.md}                          |   0
 .../prerequisites.md                          |   0
 .../setting.md}                               |   2 +-
 .../database_driven.md}                       |   0
 .../download.md => hands_on/download_data.md} |   0
 .../keyword.md => hands_on/keyword_based.md}  |   0
 _sources/hands_on/scraping_examples.md        |   7 +
 .../subreddit_based.md}                       |   0
 .../update.md => hands_on/update_data.md}     |   2 +-
 _sources/pages/ScrapingExamples.md            |   7 -
 Introduction.html => about.html               |  41 +-
 data_schema/comment.html                      | 508 +++++++++++++++++
 data_schema/submission.html                   | 522 ++++++++++++++++++
 data_schema/user.html                         | 513 +++++++++++++++++
 genindex.html                                 |  31 +-
 .../installation.html                         |  39 +-
 {pages => getting_started}/prerequisites.html |  45 +-
 .../setting.html                              |  47 +-
 .../database_driven.html                      |  45 +-
 .../download_data.html                        |  45 +-
 .../keyword_based.html                        |  45 +-
 .../scraping_examples.html                    |  53 +-
 .../subreddit_based.html                      |  45 +-
 .../update.html => hands_on/update_data.html  |  43 +-
 index.html                                    |   2 +-
 objects.inv                                   |   4 +-
 search.html                                   |  31 +-
 searchindex.js                                |   2 +-
 33 files changed, 1944 insertions(+), 228 deletions(-)
 rename _sources/{Introduction.md => about.md} (91%)
 create mode 100755 _sources/data_schema/comment.md
 create mode 100755 _sources/data_schema/submission.md
 create mode 100755 _sources/data_schema/user.md
 rename _sources/{pages/install.md => getting_started/installation.md} (100%)
 rename _sources/{pages => getting_started}/prerequisites.md (100%)
 rename _sources/{pages/GettingStarted.md => getting_started/setting.md} (92%)
 rename _sources/{pages/database.md => hands_on/database_driven.md} (100%)
 rename _sources/{pages/download.md => hands_on/download_data.md} (100%)
 rename _sources/{pages/keyword.md => hands_on/keyword_based.md} (100%)
 create mode 100755 _sources/hands_on/scraping_examples.md
 rename _sources/{pages/subreddit.md => hands_on/subreddit_based.md} (100%)
 rename _sources/{pages/update.md => hands_on/update_data.md} (73%)
 delete mode 100755 _sources/pages/ScrapingExamples.md
 rename Introduction.html => about.html (87%)
 create mode 100755 data_schema/comment.html
 create mode 100755 data_schema/submission.html
 create mode 100755 data_schema/user.html
 rename pages/install.html => getting_started/installation.html (84%)
 rename {pages => getting_started}/prerequisites.html (88%)
 rename pages/GettingStarted.html => getting_started/setting.html (89%)
 rename pages/database.html => hands_on/database_driven.html (89%)
 rename pages/download.html => hands_on/download_data.html (89%)
 rename pages/keyword.html => hands_on/keyword_based.html (88%)
 rename pages/ScrapingExamples.html => hands_on/scraping_examples.html (82%)
 rename pages/subreddit.html => hands_on/subreddit_based.html (89%)
 rename pages/update.html => hands_on/update_data.html (85%)

diff --git a/.buildinfo b/.buildinfo
index 088fb0a..f19ac0a 100755
--- a/.buildinfo
+++ b/.buildinfo
@@ -1,4 +1,4 @@
 # Sphinx build info version 1
 # This file hashes the configuration used when building these files. When it is not found, a full rebuild will be done.
-config: c980c25411b2f88e2de822371e07e90a
+config: 87d691a00f9808f83b1e8ac9849980e7
 tags: 645f666f9bcd5a90fca523b33c5a78b7
diff --git a/_sources/Introduction.md b/_sources/about.md
similarity index 91%
rename from _sources/Introduction.md
rename to _sources/about.md
index bbe1454..ad8ae23 100755
--- a/_sources/Introduction.md
+++ b/_sources/about.md
@@ -27,7 +27,7 @@ Here's how RedditHarbor empowers your research:
 * **📈 Scalable and Efficient**: Handle pagination seamlessly, even for large datasets with millions of rows. 
 * **🕹️ Customisable Collection**: Tailor your data collection to your specific needs by configuring parameters.
 * **📂 Analysis-Ready**: Export your database to CSV, JSON, or JPEG formats for effortless integration with your preferred analysis tools.
-* **🔄 Temporal Metric Tracking:**: Regularly update key metrics like upvote ratios, scores, awards, and comment counts, allowing temporal analysis - a distinct advantage over static "snapshot" databases, such as PushShift or AcademicTorrent. 
+* **🔄 Temporal Metric Tracking**: Regularly update key metrics like upvote ratios, scores, awards, and comment counts, allowing temporal analysis - a distinct advantage over static "snapshot" databases, such as PushShift or AcademicTorrent. 
 * **⚡ Smart Update Intervals**: Leverage flexible configurations to automatically adjust update intervals based on dataset size, optimising efficiency while adhering to API constraints. 
 
 With RedditHarbor, you can spend less time wrestling with technical hurdles and more time focusing on your research objectives. 
\ No newline at end of file
diff --git a/_sources/data_schema/comment.md b/_sources/data_schema/comment.md
new file mode 100755
index 0000000..2809eeb
--- /dev/null
+++ b/_sources/data_schema/comment.md
@@ -0,0 +1,23 @@
+# Comment
+
+The `Comment` collection stores information about comments made on Reddit submissions. Each document in this collection has the following schema:
+
+```python
+{
+    "comment_id": str,  # Unique identifier for the comment
+    "link_id": str,  # ID of the submission the comment is associated with
+    "subreddit": str,  # Name of the subreddit the comment is posted in
+    "parent_id": str,  # ID of the parent comment or submission
+    "redditor_id": str,  # ID of the user who posted the comment
+    "created_at": str,  # Datetime when the comment was created (ISO format)
+    "body": str or None,  # Text content of the comment (None if removed)
+    "score": {str: int},  # Dictionary mapping datetimes (ISO format) to the comment's score
+    "edited": bool,  # Whether the comment has been edited
+    "removed": str or None  # "deleted" or "removed" if the comment was removed, otherwise None
+}
+```
+
+The `parent_id` field can have two different formats:
+
+1. If it starts with `"t3_{link_id}"`, it means the comment is a top-level comment, and the parent is a submission.
+2. If it starts with `"t1_{comment_id}"`, it means the comment is a reply to another comment, and the parent is the comment with the specified `comment_id`.
\ No newline at end of file
diff --git a/_sources/data_schema/submission.md b/_sources/data_schema/submission.md
new file mode 100755
index 0000000..98cf0c3
--- /dev/null
+++ b/_sources/data_schema/submission.md
@@ -0,0 +1,37 @@
+# Submission
+
+The `Submission` collection stores information about Reddit submissions. Each document in this collection has the following schema:
+
+```python
+{
+    "submission_id": str,  # Unique identifier for the submission
+    "redditor_id": str,  # ID of the user who posted the submission
+    "created_at": str,  # Datetime when the submission was created (ISO format)
+    "title": str,  # Title of the submission
+    "text": str,  # Text content of the submission
+    "subreddit": str,  # Name of the subreddit the submission is posted in
+    "permalink": str,  # URL of the submission
+    "attachment": {str: str} or None,  # Dictionary containing URLs of attached media (e.g., {"jpg": "https://example.com/image.jpg"})
+    "flair": {
+        "link": str,  # Link flair text
+        "author": str  # Author flair text
+    },
+    "awards": {
+        "list": dict,  # Dictionary mapping award names to [count, coin_price]
+        "total_awards_count": int,  # Total number of awards received
+        "total_awards_price": int  # Total coin price of all awards received
+    },
+    "score": {str: int},  # Dictionary mapping datetimes (ISO format) to the submission's score
+    "upvote_ratio": {str: float},  # Dictionary mapping datetimes (ISO format) to the upvote ratio
+    "num_comments": {str: int},  # Dictionary mapping datetimes (ISO format) to the number of comments
+    "edited": bool,  # Whether the submission has been edited
+    "archived": bool,  # Whether the submission is archived
+    "removed": bool,  # Whether the submission has been removed
+    "poll": {
+        "total_vote_count": int,  # Total number of votes in the poll
+        "vote_ends_at": str,  # Datetime when the poll ends (ISO format)
+        "options": {str: int},  # Dictionary mapping poll options to the number of votes
+        "closed": bool  # Whether the poll is closed
+    } or None  # None if the submission does not have a poll
+}
+```
diff --git a/_sources/data_schema/user.md b/_sources/data_schema/user.md
new file mode 100755
index 0000000..3c92caf
--- /dev/null
+++ b/_sources/data_schema/user.md
@@ -0,0 +1,29 @@
+# User 
+
+The `User` collection stores information about Reddit users. Each document in this collection has the following schema:
+
+```python
+{
+    "redditor_id": str,  # Unique identifier for the user
+    "name": str,  # User's Reddit username
+    "created_at": str,  # Datetime when the user account was created (ISO format)
+    "karma": {
+        "link": int,  # Link karma
+        "total": int,  # Total karma
+        "awardee": int,  # Karma received from awards
+        "awarder": int,  # Karma awarded to others
+        "comment": int  # Comment karma
+    },
+    "is_gold": bool,  # Whether the user has Reddit Gold
+    "is_mod": {
+        str: [str, int]  # Dictionary mapping subreddit IDs to [subreddit name, number of subscribers]
+    } or None,  # None if the user is not a moderator
+    "trophy": {
+        "list": list,  # List of trophy names
+        "count": int  # Number of trophies
+    } or None,  # None if the user has no trophies
+    "removed": str  # "active" or "suspended"
+}
+```
+
+Note: For suspended users, the `redditor_id` is represented as `"suspended:{name}"`.
\ No newline at end of file
diff --git a/_sources/pages/install.md b/_sources/getting_started/installation.md
similarity index 100%
rename from _sources/pages/install.md
rename to _sources/getting_started/installation.md
diff --git a/_sources/pages/prerequisites.md b/_sources/getting_started/prerequisites.md
similarity index 100%
rename from _sources/pages/prerequisites.md
rename to _sources/getting_started/prerequisites.md
diff --git a/_sources/pages/GettingStarted.md b/_sources/getting_started/setting.md
similarity index 92%
rename from _sources/pages/GettingStarted.md
rename to _sources/getting_started/setting.md
index 754ec19..cec3333 100755
--- a/_sources/pages/GettingStarted.md
+++ b/_sources/getting_started/setting.md
@@ -66,7 +66,7 @@ CREATE TABLE test_comment(
 ALTER TABLE test_comment ENABLE ROW LEVEL SECURITY;
 ```
 
-This will create the three tables with the necessary columns and data types. Once created, you'll see the new tables available in the "Table Editor". In the future, you can duplicate and rename these tables (instead of "test_...") for your production needs.
+This will create the three tables with the necessary columns and data types. Once created, you'll see the new tables available in the "Table Editor". In the future, you can duplicate and rename these tables (instead of "test_...") for your production needs. For a structured overview of the database schema used by RedditHarbor, including detailed explanations of each field and its data type, see [Database Schema](../data_schema/user.md). 
 
 ```{warning} 
 The RedditHarbor package depends on predefined column names for all user, submission, and comment tables. To ensure proper functionality, it's crucial to create tables with all the specified columns mentioned in the documentation. Failure to do so may lead to errors or incomplete data retrieval.
diff --git a/_sources/pages/database.md b/_sources/hands_on/database_driven.md
similarity index 100%
rename from _sources/pages/database.md
rename to _sources/hands_on/database_driven.md
diff --git a/_sources/pages/download.md b/_sources/hands_on/download_data.md
similarity index 100%
rename from _sources/pages/download.md
rename to _sources/hands_on/download_data.md
diff --git a/_sources/pages/keyword.md b/_sources/hands_on/keyword_based.md
similarity index 100%
rename from _sources/pages/keyword.md
rename to _sources/hands_on/keyword_based.md
diff --git a/_sources/hands_on/scraping_examples.md b/_sources/hands_on/scraping_examples.md
new file mode 100755
index 0000000..7bedfad
--- /dev/null
+++ b/_sources/hands_on/scraping_examples.md
@@ -0,0 +1,7 @@
+# Scraping Examples
+
+This section will cover frequently used scenarios from researchers for collecting Reddit data.
+
+* [Collecting Subreddit-based Data](../hands_on/subreddit_based.md): Provides guidance on collecting data from specific subreddits
+* [Collecting Keyword-based Data](../hands_on/keyword_based.md): Covers collecting submissions based on specific keywords
+* [Database-Driven Data Collection](../hands_on/database_driven.md): Explains how to leverage an existing database (previously collected Reddit data) to collect additional relevant data
\ No newline at end of file
diff --git a/_sources/pages/subreddit.md b/_sources/hands_on/subreddit_based.md
similarity index 100%
rename from _sources/pages/subreddit.md
rename to _sources/hands_on/subreddit_based.md
diff --git a/_sources/pages/update.md b/_sources/hands_on/update_data.md
similarity index 73%
rename from _sources/pages/update.md
rename to _sources/hands_on/update_data.md
index 0ccb4d7..54e702a 100755
--- a/_sources/pages/update.md
+++ b/_sources/hands_on/update_data.md
@@ -2,7 +2,7 @@
 
 ## Unlock temporal insights 📈 with intelligent updates 🔄
 
-`RedditHarbor`'s update module streamlines and automates the process of updating crucial metrics for existing submissions (comment and user is currently working-in-progress!). It provides flexibility and configurability to adjust update intervals and data sources. A key advantage of this update module is the ability to track how various metrics, such as the upvote ratio or score, change over time for specific posts. This capability sets RedditHarbor apart from many other Reddit database resources, such as PushShift or Academic Torrents, which typically provide a static "snapshot" of submissions and comments at a random point in time.
+The `update()` module streamlines and automates the process of updating crucial metrics for existing submissions (comment and user is currently working-in-progress!). It provides flexibility and configurability to adjust update intervals and data sources. A key advantage of this update module is the ability to track how various metrics, such as the upvote ratio or score, change over time for specific posts. This capability sets RedditHarbor apart from many other Reddit database resources, such as PushShift or Academic Torrents, which typically provide a static "snapshot" of submissions and comments at a random point in time.
 
 ## Updating Submissions
 To update submission data, follow these steps:
diff --git a/_sources/pages/ScrapingExamples.md b/_sources/pages/ScrapingExamples.md
deleted file mode 100755
index 35fe9dc..0000000
--- a/_sources/pages/ScrapingExamples.md
+++ /dev/null
@@ -1,7 +0,0 @@
-# Scraping Examples
-
-This section will cover frequently used scenarios from researchers for collecting Reddit data.
-
-* [Collecting Subreddit-based Data](../pages/subreddit.md): Provides guidance on collecting data from specific subreddits
-* [Collecting Keyword-based Data](../pages/keyword.md): Covers collecting submissions based on specific keywords
-* [Database-Driven Data Collection](../pages/database.md): Explains how to leverage an existing database (previously collected Reddit data) to collect additional relevant data
\ No newline at end of file
diff --git a/Introduction.html b/about.html
similarity index 87%
rename from Introduction.html
rename to about.html
index d004ef0..3f6bf5b 100755
--- a/Introduction.html
+++ b/about.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>About &#8212; ICWSM 2024 Tutorial</title>
+    <title>About &#8212; RedditHarbor</title>
   
   
   
@@ -60,11 +60,12 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'Introduction';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'about';</script>
     <link rel="shortcut icon" href="_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="#" />
     <link rel="index" title="Index" href="genindex.html" />
     <link rel="search" title="Search" href="search.html" />
-    <link rel="next" title="Prerequisites" href="pages/prerequisites.html" />
+    <link rel="next" title="Prerequisites" href="getting_started/prerequisites.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -157,20 +158,26 @@
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="pages/prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="pages/ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="pages/subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pages/download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -242,7 +249,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2FIntroduction.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fabout.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -272,7 +279,7 @@
       
       
       
-      <li><a href="_sources/Introduction.md" target="_blank"
+      <li><a href="_sources/about.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -410,7 +417,7 @@ <h3>RedditHarbor<a class="headerlink" href="#redditharbor" title="Permalink to t
 <li><p><strong>📈 Scalable and Efficient</strong>: Handle pagination seamlessly, even for large datasets with millions of rows.</p></li>
 <li><p><strong>🕹️ Customisable Collection</strong>: Tailor your data collection to your specific needs by configuring parameters.</p></li>
 <li><p><strong>📂 Analysis-Ready</strong>: Export your database to CSV, JSON, or JPEG formats for effortless integration with your preferred analysis tools.</p></li>
-<li><p><strong>🔄 Temporal Metric Tracking:</strong>: Regularly update key metrics like upvote ratios, scores, awards, and comment counts, allowing temporal analysis - a distinct advantage over static “snapshot” databases, such as PushShift or AcademicTorrent.</p></li>
+<li><p><strong>🔄 Temporal Metric Tracking</strong>: Regularly update key metrics like upvote ratios, scores, awards, and comment counts, allowing temporal analysis - a distinct advantage over static “snapshot” databases, such as PushShift or AcademicTorrent.</p></li>
 <li><p><strong>⚡ Smart Update Intervals</strong>: Leverage flexible configurations to automatically adjust update intervals based on dataset size, optimising efficiency while adhering to API constraints.</p></li>
 </ul>
 <p>With RedditHarbor, you can spend less time wrestling with technical hurdles and more time focusing on your research objectives.</p>
@@ -420,6 +427,8 @@ <h3>RedditHarbor<a class="headerlink" href="#redditharbor" title="Permalink to t
 </div>
 <div class="toctree-wrapper compound">
 </div>
+<div class="toctree-wrapper compound">
+</div>
 </section>
 
     <script type="text/x-thebe-config">
@@ -454,7 +463,7 @@ <h3>RedditHarbor<a class="headerlink" href="#redditharbor" title="Permalink to t
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="right-next"
-       href="pages/prerequisites.html"
+       href="getting_started/prerequisites.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/data_schema/comment.html b/data_schema/comment.html
new file mode 100755
index 0000000..b4b525b
--- /dev/null
+++ b/data_schema/comment.html
@@ -0,0 +1,508 @@
+
+
+<!DOCTYPE html>
+
+
+<html >
+
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
+
+    <title>Comment &#8212; RedditHarbor</title>
+  
+  
+  
+  <script data-cfasync="false">
+    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
+    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
+  </script>
+  
+  <!-- Loaded before other Sphinx assets -->
+  <link href="../_static/styles/theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/bootstrap.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/pydata-sphinx-theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+
+  
+  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=e353d410970836974a52" rel="stylesheet" />
+  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
+
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
+    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
+    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
+  
+  <!-- Pre-loaded scripts that we'll load fully later -->
+  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=e353d410970836974a52" />
+<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52" />
+
+    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
+    <script src="../_static/jquery.js"></script>
+    <script src="../_static/underscore.js"></script>
+    <script src="../_static/doctools.js"></script>
+    <script src="../_static/clipboard.min.js"></script>
+    <script src="../_static/copybutton.js"></script>
+    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
+    <script>let toggleHintShow = 'Click to show';</script>
+    <script>let toggleHintHide = 'Click to hide';</script>
+    <script>let toggleOpenOnPrint = 'true';</script>
+    <script src="../_static/togglebutton.js"></script>
+    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
+    <script src="../_static/design-tabs.js"></script>
+    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
+const thebe_selector = ".thebe,.cell"
+const thebe_selector_input = "pre"
+const thebe_selector_output = ".output, .cell_output"
+</script>
+    <script async="async" src="../_static/sphinx-thebe.js"></script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'data_schema/comment';</script>
+    <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="Scraping Examples" href="../hands_on/scraping_examples.html" />
+    <link rel="prev" title="Submission" href="submission.html" />
+  <meta name="viewport" content="width=device-width, initial-scale=1"/>
+  <meta name="docsearch:language" content="None"/>
+  </head>
+  
+  
+  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
+
+  
+  
+  <a class="skip-link" href="#main-content">Skip to main content</a>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__primary"
+          id="__primary"/>
+  <label class="overlay overlay-primary" for="__primary"></label>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__secondary"
+          id="__secondary"/>
+  <label class="overlay overlay-secondary" for="__secondary"></label>
+  
+  <div class="search-button__wrapper">
+    <div class="search-button__overlay"></div>
+    <div class="search-button__search-container">
+<form class="bd-search d-flex align-items-center"
+      action="../search.html"
+      method="get">
+  <i class="fa-solid fa-magnifying-glass"></i>
+  <input type="search"
+         class="form-control"
+         name="q"
+         id="search-input"
+         placeholder="Search this book..."
+         aria-label="Search this book..."
+         autocomplete="off"
+         autocorrect="off"
+         autocapitalize="off"
+         spellcheck="false"/>
+  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
+</form></div>
+  </div>
+  
+    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
+    </nav>
+  
+  <div class="bd-container">
+    <div class="bd-container__inner bd-page-width">
+      
+      <div class="bd-sidebar-primary bd-sidebar">
+        
+
+  
+  <div class="sidebar-header-items sidebar-primary__section">
+    
+    
+    
+    
+  </div>
+  
+    <div class="sidebar-primary-items__start sidebar-primary__section">
+        <div class="sidebar-primary-item">
+  
+
+<a class="navbar-brand logo" href="../about.html">
+  
+  
+  
+  
+    
+    
+      
+    
+    
+    <img src="../_static/socius_logo.png" class="logo__image only-light" alt="Logo image"/>
+    <script>document.write(`<img src="../_static/socius_logo.png" class="logo__image only-dark" alt="Logo image"/>`);</script>
+  
+  
+</a></div>
+        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
+    <div class="bd-toc-item navbar-nav active">
+        
+        <ul class="nav bd-sidenav bd-sidenav__home-link">
+            <li class="toctree-l1">
+                <a class="reference internal" href="../about.html">
+                    About
+                </a>
+            </li>
+        </ul>
+        <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="current nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="submission.html">Submission</a></li>
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">Comment</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
+</ul>
+
+    </div>
+</nav></div>
+    </div>
+  
+  
+  <div class="sidebar-primary-items__end sidebar-primary__section">
+  </div>
+  
+  <div id="rtd-footer-container"></div>
+
+
+      </div>
+      
+      <main id="main-content" class="bd-main">
+        
+        
+
+<div class="sbt-scroll-pixel-helper"></div>
+
+          <div class="bd-content">
+            <div class="bd-article-container">
+              
+              <div class="bd-header-article">
+<div class="header-article-items header-article__inner">
+  
+    <div class="header-article-items__start">
+      
+        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
+  <span class="fa-solid fa-bars"></span>
+</label></div>
+      
+    </div>
+  
+  
+    <div class="header-article-items__end">
+      
+        <div class="header-article-item">
+
+<div class="article-header-buttons">
+
+
+
+
+
+<div class="dropdown dropdown-source-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
+    <i class="fab fa-github"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor" target="_blank"
+   class="btn btn-sm btn-source-repository-button dropdown-item"
+   title="Source repository"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fab fa-github"></i>
+  </span>
+<span class="btn__text-container">Repository</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fdata_schema/comment.html&body=Your%20issue%20content%20here." target="_blank"
+   class="btn btn-sm btn-source-issues-button dropdown-item"
+   title="Open an issue"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-lightbulb"></i>
+  </span>
+<span class="btn__text-container">Open issue</span>
+</a>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+
+
+<div class="dropdown dropdown-download-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
+    <i class="fas fa-download"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="../_sources/data_schema/comment.md" target="_blank"
+   class="btn btn-sm btn-download-source-button dropdown-item"
+   title="Download source file"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file"></i>
+  </span>
+<span class="btn__text-container">.md</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li>
+<button onclick="window.print()"
+  class="btn btn-sm btn-download-pdf-button dropdown-item"
+  title="Print to PDF"
+  data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file-pdf"></i>
+  </span>
+<span class="btn__text-container">.pdf</span>
+</button>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+<button onclick="toggleFullScreen()"
+  class="btn btn-sm btn-fullscreen-button"
+  title="Fullscreen mode"
+  data-bs-placement="bottom" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-expand"></i>
+  </span>
+
+</button>
+
+
+<script>
+document.write(`
+  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
+    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
+    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
+  </button>
+`);
+</script>
+
+<script>
+document.write(`
+  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <i class="fa-solid fa-magnifying-glass"></i>
+  </button>
+`);
+</script>
+
+</div></div>
+      
+    </div>
+  
+</div>
+</div>
+              
+              
+
+<div id="jb-print-docs-body" class="onlyprint">
+    <h1>Comment</h1>
+    <!-- Table of contents -->
+    <div id="print-main-content">
+        <div id="jb-print-toc">
+            
+        </div>
+    </div>
+</div>
+
+              
+                
+<div id="searchbox"></div>
+                <article class="bd-article" role="main">
+                  
+  <section class="tex2jax_ignore mathjax_ignore" id="comment">
+<h1>Comment<a class="headerlink" href="#comment" title="Permalink to this headline">#</a></h1>
+<p>The <code class="docutils literal notranslate"><span class="pre">Comment</span></code> collection stores information about comments made on Reddit submissions. Each document in this collection has the following schema:</p>
+<div class="highlight-python notranslate"><div class="highlight"><pre><span></span><span class="p">{</span>
+    <span class="s2">&quot;comment_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Unique identifier for the comment</span>
+    <span class="s2">&quot;link_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># ID of the submission the comment is associated with</span>
+    <span class="s2">&quot;subreddit&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Name of the subreddit the comment is posted in</span>
+    <span class="s2">&quot;parent_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># ID of the parent comment or submission</span>
+    <span class="s2">&quot;redditor_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># ID of the user who posted the comment</span>
+    <span class="s2">&quot;created_at&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Datetime when the comment was created (ISO format)</span>
+    <span class="s2">&quot;body&quot;</span><span class="p">:</span> <span class="nb">str</span> <span class="ow">or</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># Text content of the comment (None if removed)</span>
+    <span class="s2">&quot;score&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">int</span><span class="p">},</span>  <span class="c1"># Dictionary mapping datetimes (ISO format) to the comment&#39;s score</span>
+    <span class="s2">&quot;edited&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>  <span class="c1"># Whether the comment has been edited</span>
+    <span class="s2">&quot;removed&quot;</span><span class="p">:</span> <span class="nb">str</span> <span class="ow">or</span> <span class="kc">None</span>  <span class="c1"># &quot;deleted&quot; or &quot;removed&quot; if the comment was removed, otherwise None</span>
+<span class="p">}</span>
+</pre></div>
+</div>
+<p>The <code class="docutils literal notranslate"><span class="pre">parent_id</span></code> field can have two different formats:</p>
+<ol class="arabic simple">
+<li><p>If it starts with <code class="docutils literal notranslate"><span class="pre">&quot;t3_{link_id}&quot;</span></code>, it means the comment is a top-level comment, and the parent is a submission.</p></li>
+<li><p>If it starts with <code class="docutils literal notranslate"><span class="pre">&quot;t1_{comment_id}&quot;</span></code>, it means the comment is a reply to another comment, and the parent is the comment with the specified <code class="docutils literal notranslate"><span class="pre">comment_id</span></code>.</p></li>
+</ol>
+</section>
+
+    <script type="text/x-thebe-config">
+    {
+        requestKernel: true,
+        binderOptions: {
+            repo: "binder-examples/jupyter-stacks-datascience",
+            ref: "master",
+        },
+        codeMirrorConfig: {
+            theme: "abcdef",
+            mode: "python"
+        },
+        kernelOptions: {
+            name: "python3",
+            path: "./data_schema"
+        },
+        predefinedOutput: true
+    }
+    </script>
+    <script>kernelName = 'python3'</script>
+
+                </article>
+              
+
+              
+              
+                <footer class="bd-footer-article">
+                  
+<div class="footer-article-items footer-article__inner">
+  
+    <div class="footer-article-item"><!-- Previous / next buttons -->
+<div class="prev-next-area">
+    <a class="left-prev"
+       href="submission.html"
+       title="previous page">
+      <i class="fa-solid fa-angle-left"></i>
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">previous</p>
+        <p class="prev-next-title">Submission</p>
+      </div>
+    </a>
+    <a class="right-next"
+       href="../hands_on/scraping_examples.html"
+       title="next page">
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">next</p>
+        <p class="prev-next-title">Scraping Examples</p>
+      </div>
+      <i class="fa-solid fa-angle-right"></i>
+    </a>
+</div></div>
+  
+</div>
+
+                </footer>
+              
+            </div>
+            
+            
+              
+            
+          </div>
+          <footer class="bd-footer-content">
+            
+<div class="bd-footer-content__inner container">
+  
+  <div class="footer-item">
+    
+<p class="component-author">
+By socius
+</p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  <p class="copyright">
+    
+      © Copyright 2024.
+      <br/>
+    
+  </p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+</div>
+          </footer>
+        
+
+      </main>
+    </div>
+  </div>
+  
+  <!-- Scripts loaded after <body> so the DOM is not blocked -->
+  <script src="../_static/scripts/bootstrap.js?digest=e353d410970836974a52"></script>
+<script src="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52"></script>
+
+  <footer class="bd-footer">
+  </footer>
+  </body>
+</html>
\ No newline at end of file
diff --git a/data_schema/submission.html b/data_schema/submission.html
new file mode 100755
index 0000000..e1c5739
--- /dev/null
+++ b/data_schema/submission.html
@@ -0,0 +1,522 @@
+
+
+<!DOCTYPE html>
+
+
+<html >
+
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
+
+    <title>Submission &#8212; RedditHarbor</title>
+  
+  
+  
+  <script data-cfasync="false">
+    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
+    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
+  </script>
+  
+  <!-- Loaded before other Sphinx assets -->
+  <link href="../_static/styles/theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/bootstrap.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/pydata-sphinx-theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+
+  
+  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=e353d410970836974a52" rel="stylesheet" />
+  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
+
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
+    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
+    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
+  
+  <!-- Pre-loaded scripts that we'll load fully later -->
+  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=e353d410970836974a52" />
+<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52" />
+
+    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
+    <script src="../_static/jquery.js"></script>
+    <script src="../_static/underscore.js"></script>
+    <script src="../_static/doctools.js"></script>
+    <script src="../_static/clipboard.min.js"></script>
+    <script src="../_static/copybutton.js"></script>
+    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
+    <script>let toggleHintShow = 'Click to show';</script>
+    <script>let toggleHintHide = 'Click to hide';</script>
+    <script>let toggleOpenOnPrint = 'true';</script>
+    <script src="../_static/togglebutton.js"></script>
+    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
+    <script src="../_static/design-tabs.js"></script>
+    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
+const thebe_selector = ".thebe,.cell"
+const thebe_selector_input = "pre"
+const thebe_selector_output = ".output, .cell_output"
+</script>
+    <script async="async" src="../_static/sphinx-thebe.js"></script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'data_schema/submission';</script>
+    <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="Comment" href="comment.html" />
+    <link rel="prev" title="User" href="user.html" />
+  <meta name="viewport" content="width=device-width, initial-scale=1"/>
+  <meta name="docsearch:language" content="None"/>
+  </head>
+  
+  
+  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
+
+  
+  
+  <a class="skip-link" href="#main-content">Skip to main content</a>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__primary"
+          id="__primary"/>
+  <label class="overlay overlay-primary" for="__primary"></label>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__secondary"
+          id="__secondary"/>
+  <label class="overlay overlay-secondary" for="__secondary"></label>
+  
+  <div class="search-button__wrapper">
+    <div class="search-button__overlay"></div>
+    <div class="search-button__search-container">
+<form class="bd-search d-flex align-items-center"
+      action="../search.html"
+      method="get">
+  <i class="fa-solid fa-magnifying-glass"></i>
+  <input type="search"
+         class="form-control"
+         name="q"
+         id="search-input"
+         placeholder="Search this book..."
+         aria-label="Search this book..."
+         autocomplete="off"
+         autocorrect="off"
+         autocapitalize="off"
+         spellcheck="false"/>
+  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
+</form></div>
+  </div>
+  
+    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
+    </nav>
+  
+  <div class="bd-container">
+    <div class="bd-container__inner bd-page-width">
+      
+      <div class="bd-sidebar-primary bd-sidebar">
+        
+
+  
+  <div class="sidebar-header-items sidebar-primary__section">
+    
+    
+    
+    
+  </div>
+  
+    <div class="sidebar-primary-items__start sidebar-primary__section">
+        <div class="sidebar-primary-item">
+  
+
+<a class="navbar-brand logo" href="../about.html">
+  
+  
+  
+  
+    
+    
+      
+    
+    
+    <img src="../_static/socius_logo.png" class="logo__image only-light" alt="Logo image"/>
+    <script>document.write(`<img src="../_static/socius_logo.png" class="logo__image only-dark" alt="Logo image"/>`);</script>
+  
+  
+</a></div>
+        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
+    <div class="bd-toc-item navbar-nav active">
+        
+        <ul class="nav bd-sidenav bd-sidenav__home-link">
+            <li class="toctree-l1">
+                <a class="reference internal" href="../about.html">
+                    About
+                </a>
+            </li>
+        </ul>
+        <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="current nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="user.html">User</a></li>
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="comment.html">Comment</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
+</ul>
+
+    </div>
+</nav></div>
+    </div>
+  
+  
+  <div class="sidebar-primary-items__end sidebar-primary__section">
+  </div>
+  
+  <div id="rtd-footer-container"></div>
+
+
+      </div>
+      
+      <main id="main-content" class="bd-main">
+        
+        
+
+<div class="sbt-scroll-pixel-helper"></div>
+
+          <div class="bd-content">
+            <div class="bd-article-container">
+              
+              <div class="bd-header-article">
+<div class="header-article-items header-article__inner">
+  
+    <div class="header-article-items__start">
+      
+        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
+  <span class="fa-solid fa-bars"></span>
+</label></div>
+      
+    </div>
+  
+  
+    <div class="header-article-items__end">
+      
+        <div class="header-article-item">
+
+<div class="article-header-buttons">
+
+
+
+
+
+<div class="dropdown dropdown-source-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
+    <i class="fab fa-github"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor" target="_blank"
+   class="btn btn-sm btn-source-repository-button dropdown-item"
+   title="Source repository"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fab fa-github"></i>
+  </span>
+<span class="btn__text-container">Repository</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fdata_schema/submission.html&body=Your%20issue%20content%20here." target="_blank"
+   class="btn btn-sm btn-source-issues-button dropdown-item"
+   title="Open an issue"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-lightbulb"></i>
+  </span>
+<span class="btn__text-container">Open issue</span>
+</a>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+
+
+<div class="dropdown dropdown-download-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
+    <i class="fas fa-download"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="../_sources/data_schema/submission.md" target="_blank"
+   class="btn btn-sm btn-download-source-button dropdown-item"
+   title="Download source file"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file"></i>
+  </span>
+<span class="btn__text-container">.md</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li>
+<button onclick="window.print()"
+  class="btn btn-sm btn-download-pdf-button dropdown-item"
+  title="Print to PDF"
+  data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file-pdf"></i>
+  </span>
+<span class="btn__text-container">.pdf</span>
+</button>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+<button onclick="toggleFullScreen()"
+  class="btn btn-sm btn-fullscreen-button"
+  title="Fullscreen mode"
+  data-bs-placement="bottom" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-expand"></i>
+  </span>
+
+</button>
+
+
+<script>
+document.write(`
+  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
+    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
+    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
+  </button>
+`);
+</script>
+
+<script>
+document.write(`
+  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <i class="fa-solid fa-magnifying-glass"></i>
+  </button>
+`);
+</script>
+
+</div></div>
+      
+    </div>
+  
+</div>
+</div>
+              
+              
+
+<div id="jb-print-docs-body" class="onlyprint">
+    <h1>Submission</h1>
+    <!-- Table of contents -->
+    <div id="print-main-content">
+        <div id="jb-print-toc">
+            
+        </div>
+    </div>
+</div>
+
+              
+                
+<div id="searchbox"></div>
+                <article class="bd-article" role="main">
+                  
+  <section class="tex2jax_ignore mathjax_ignore" id="submission">
+<h1>Submission<a class="headerlink" href="#submission" title="Permalink to this headline">#</a></h1>
+<p>The <code class="docutils literal notranslate"><span class="pre">Submission</span></code> collection stores information about Reddit submissions. Each document in this collection has the following schema:</p>
+<div class="highlight-python notranslate"><div class="highlight"><pre><span></span><span class="p">{</span>
+    <span class="s2">&quot;submission_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Unique identifier for the submission</span>
+    <span class="s2">&quot;redditor_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># ID of the user who posted the submission</span>
+    <span class="s2">&quot;created_at&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Datetime when the submission was created (ISO format)</span>
+    <span class="s2">&quot;title&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Title of the submission</span>
+    <span class="s2">&quot;text&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Text content of the submission</span>
+    <span class="s2">&quot;subreddit&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Name of the subreddit the submission is posted in</span>
+    <span class="s2">&quot;permalink&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># URL of the submission</span>
+    <span class="s2">&quot;attachment&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">str</span><span class="p">}</span> <span class="ow">or</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># Dictionary containing URLs of attached media (e.g., {&quot;jpg&quot;: &quot;https://example.com/image.jpg&quot;})</span>
+    <span class="s2">&quot;flair&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="s2">&quot;link&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Link flair text</span>
+        <span class="s2">&quot;author&quot;</span><span class="p">:</span> <span class="nb">str</span>  <span class="c1"># Author flair text</span>
+    <span class="p">},</span>
+    <span class="s2">&quot;awards&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="s2">&quot;list&quot;</span><span class="p">:</span> <span class="nb">dict</span><span class="p">,</span>  <span class="c1"># Dictionary mapping award names to [count, coin_price]</span>
+        <span class="s2">&quot;total_awards_count&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Total number of awards received</span>
+        <span class="s2">&quot;total_awards_price&quot;</span><span class="p">:</span> <span class="nb">int</span>  <span class="c1"># Total coin price of all awards received</span>
+    <span class="p">},</span>
+    <span class="s2">&quot;score&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">int</span><span class="p">},</span>  <span class="c1"># Dictionary mapping datetimes (ISO format) to the submission&#39;s score</span>
+    <span class="s2">&quot;upvote_ratio&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">float</span><span class="p">},</span>  <span class="c1"># Dictionary mapping datetimes (ISO format) to the upvote ratio</span>
+    <span class="s2">&quot;num_comments&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">int</span><span class="p">},</span>  <span class="c1"># Dictionary mapping datetimes (ISO format) to the number of comments</span>
+    <span class="s2">&quot;edited&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>  <span class="c1"># Whether the submission has been edited</span>
+    <span class="s2">&quot;archived&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>  <span class="c1"># Whether the submission is archived</span>
+    <span class="s2">&quot;removed&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>  <span class="c1"># Whether the submission has been removed</span>
+    <span class="s2">&quot;poll&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="s2">&quot;total_vote_count&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Total number of votes in the poll</span>
+        <span class="s2">&quot;vote_ends_at&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Datetime when the poll ends (ISO format)</span>
+        <span class="s2">&quot;options&quot;</span><span class="p">:</span> <span class="p">{</span><span class="nb">str</span><span class="p">:</span> <span class="nb">int</span><span class="p">},</span>  <span class="c1"># Dictionary mapping poll options to the number of votes</span>
+        <span class="s2">&quot;closed&quot;</span><span class="p">:</span> <span class="nb">bool</span>  <span class="c1"># Whether the poll is closed</span>
+    <span class="p">}</span> <span class="ow">or</span> <span class="kc">None</span>  <span class="c1"># None if the submission does not have a poll</span>
+<span class="p">}</span>
+</pre></div>
+</div>
+</section>
+
+    <script type="text/x-thebe-config">
+    {
+        requestKernel: true,
+        binderOptions: {
+            repo: "binder-examples/jupyter-stacks-datascience",
+            ref: "master",
+        },
+        codeMirrorConfig: {
+            theme: "abcdef",
+            mode: "python"
+        },
+        kernelOptions: {
+            name: "python3",
+            path: "./data_schema"
+        },
+        predefinedOutput: true
+    }
+    </script>
+    <script>kernelName = 'python3'</script>
+
+                </article>
+              
+
+              
+              
+                <footer class="bd-footer-article">
+                  
+<div class="footer-article-items footer-article__inner">
+  
+    <div class="footer-article-item"><!-- Previous / next buttons -->
+<div class="prev-next-area">
+    <a class="left-prev"
+       href="user.html"
+       title="previous page">
+      <i class="fa-solid fa-angle-left"></i>
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">previous</p>
+        <p class="prev-next-title">User</p>
+      </div>
+    </a>
+    <a class="right-next"
+       href="comment.html"
+       title="next page">
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">next</p>
+        <p class="prev-next-title">Comment</p>
+      </div>
+      <i class="fa-solid fa-angle-right"></i>
+    </a>
+</div></div>
+  
+</div>
+
+                </footer>
+              
+            </div>
+            
+            
+              
+            
+          </div>
+          <footer class="bd-footer-content">
+            
+<div class="bd-footer-content__inner container">
+  
+  <div class="footer-item">
+    
+<p class="component-author">
+By socius
+</p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  <p class="copyright">
+    
+      © Copyright 2024.
+      <br/>
+    
+  </p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+</div>
+          </footer>
+        
+
+      </main>
+    </div>
+  </div>
+  
+  <!-- Scripts loaded after <body> so the DOM is not blocked -->
+  <script src="../_static/scripts/bootstrap.js?digest=e353d410970836974a52"></script>
+<script src="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52"></script>
+
+  <footer class="bd-footer">
+  </footer>
+  </body>
+</html>
\ No newline at end of file
diff --git a/data_schema/user.html b/data_schema/user.html
new file mode 100755
index 0000000..e43c2b7
--- /dev/null
+++ b/data_schema/user.html
@@ -0,0 +1,513 @@
+
+
+<!DOCTYPE html>
+
+
+<html >
+
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
+
+    <title>User &#8212; RedditHarbor</title>
+  
+  
+  
+  <script data-cfasync="false">
+    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
+    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
+  </script>
+  
+  <!-- Loaded before other Sphinx assets -->
+  <link href="../_static/styles/theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/bootstrap.css?digest=e353d410970836974a52" rel="stylesheet" />
+<link href="../_static/styles/pydata-sphinx-theme.css?digest=e353d410970836974a52" rel="stylesheet" />
+
+  
+  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=e353d410970836974a52" rel="stylesheet" />
+  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
+<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
+
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
+    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
+    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
+    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
+  
+  <!-- Pre-loaded scripts that we'll load fully later -->
+  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=e353d410970836974a52" />
+<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52" />
+
+    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
+    <script src="../_static/jquery.js"></script>
+    <script src="../_static/underscore.js"></script>
+    <script src="../_static/doctools.js"></script>
+    <script src="../_static/clipboard.min.js"></script>
+    <script src="../_static/copybutton.js"></script>
+    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
+    <script>let toggleHintShow = 'Click to show';</script>
+    <script>let toggleHintHide = 'Click to hide';</script>
+    <script>let toggleOpenOnPrint = 'true';</script>
+    <script src="../_static/togglebutton.js"></script>
+    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
+    <script src="../_static/design-tabs.js"></script>
+    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
+const thebe_selector = ".thebe,.cell"
+const thebe_selector_input = "pre"
+const thebe_selector_output = ".output, .cell_output"
+</script>
+    <script async="async" src="../_static/sphinx-thebe.js"></script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'data_schema/user';</script>
+    <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="Submission" href="submission.html" />
+    <link rel="prev" title="Getting Started" href="../getting_started/setting.html" />
+  <meta name="viewport" content="width=device-width, initial-scale=1"/>
+  <meta name="docsearch:language" content="None"/>
+  </head>
+  
+  
+  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
+
+  
+  
+  <a class="skip-link" href="#main-content">Skip to main content</a>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__primary"
+          id="__primary"/>
+  <label class="overlay overlay-primary" for="__primary"></label>
+  
+  <input type="checkbox"
+          class="sidebar-toggle"
+          name="__secondary"
+          id="__secondary"/>
+  <label class="overlay overlay-secondary" for="__secondary"></label>
+  
+  <div class="search-button__wrapper">
+    <div class="search-button__overlay"></div>
+    <div class="search-button__search-container">
+<form class="bd-search d-flex align-items-center"
+      action="../search.html"
+      method="get">
+  <i class="fa-solid fa-magnifying-glass"></i>
+  <input type="search"
+         class="form-control"
+         name="q"
+         id="search-input"
+         placeholder="Search this book..."
+         aria-label="Search this book..."
+         autocomplete="off"
+         autocorrect="off"
+         autocapitalize="off"
+         spellcheck="false"/>
+  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
+</form></div>
+  </div>
+  
+    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
+    </nav>
+  
+  <div class="bd-container">
+    <div class="bd-container__inner bd-page-width">
+      
+      <div class="bd-sidebar-primary bd-sidebar">
+        
+
+  
+  <div class="sidebar-header-items sidebar-primary__section">
+    
+    
+    
+    
+  </div>
+  
+    <div class="sidebar-primary-items__start sidebar-primary__section">
+        <div class="sidebar-primary-item">
+  
+
+<a class="navbar-brand logo" href="../about.html">
+  
+  
+  
+  
+    
+    
+      
+    
+    
+    <img src="../_static/socius_logo.png" class="logo__image only-light" alt="Logo image"/>
+    <script>document.write(`<img src="../_static/socius_logo.png" class="logo__image only-dark" alt="Logo image"/>`);</script>
+  
+  
+</a></div>
+        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
+    <div class="bd-toc-item navbar-nav active">
+        
+        <ul class="nav bd-sidenav bd-sidenav__home-link">
+            <li class="toctree-l1">
+                <a class="reference internal" href="../about.html">
+                    About
+                </a>
+            </li>
+        </ul>
+        <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="current nav bd-sidenav">
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="comment.html">Comment</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
+</ul>
+
+    </div>
+</nav></div>
+    </div>
+  
+  
+  <div class="sidebar-primary-items__end sidebar-primary__section">
+  </div>
+  
+  <div id="rtd-footer-container"></div>
+
+
+      </div>
+      
+      <main id="main-content" class="bd-main">
+        
+        
+
+<div class="sbt-scroll-pixel-helper"></div>
+
+          <div class="bd-content">
+            <div class="bd-article-container">
+              
+              <div class="bd-header-article">
+<div class="header-article-items header-article__inner">
+  
+    <div class="header-article-items__start">
+      
+        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
+  <span class="fa-solid fa-bars"></span>
+</label></div>
+      
+    </div>
+  
+  
+    <div class="header-article-items__end">
+      
+        <div class="header-article-item">
+
+<div class="article-header-buttons">
+
+
+
+
+
+<div class="dropdown dropdown-source-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
+    <i class="fab fa-github"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor" target="_blank"
+   class="btn btn-sm btn-source-repository-button dropdown-item"
+   title="Source repository"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fab fa-github"></i>
+  </span>
+<span class="btn__text-container">Repository</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fdata_schema/user.html&body=Your%20issue%20content%20here." target="_blank"
+   class="btn btn-sm btn-source-issues-button dropdown-item"
+   title="Open an issue"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-lightbulb"></i>
+  </span>
+<span class="btn__text-container">Open issue</span>
+</a>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+
+
+<div class="dropdown dropdown-download-buttons">
+  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
+    <i class="fas fa-download"></i>
+  </button>
+  <ul class="dropdown-menu">
+      
+      
+      
+      <li><a href="../_sources/data_schema/user.md" target="_blank"
+   class="btn btn-sm btn-download-source-button dropdown-item"
+   title="Download source file"
+   data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file"></i>
+  </span>
+<span class="btn__text-container">.md</span>
+</a>
+</li>
+      
+      
+      
+      
+      <li>
+<button onclick="window.print()"
+  class="btn btn-sm btn-download-pdf-button dropdown-item"
+  title="Print to PDF"
+  data-bs-placement="left" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-file-pdf"></i>
+  </span>
+<span class="btn__text-container">.pdf</span>
+</button>
+</li>
+      
+  </ul>
+</div>
+
+
+
+
+<button onclick="toggleFullScreen()"
+  class="btn btn-sm btn-fullscreen-button"
+  title="Fullscreen mode"
+  data-bs-placement="bottom" data-bs-toggle="tooltip"
+>
+  
+
+<span class="btn__icon-container">
+  <i class="fas fa-expand"></i>
+  </span>
+
+</button>
+
+
+<script>
+document.write(`
+  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
+    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
+    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
+  </button>
+`);
+</script>
+
+<script>
+document.write(`
+  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
+    <i class="fa-solid fa-magnifying-glass"></i>
+  </button>
+`);
+</script>
+
+</div></div>
+      
+    </div>
+  
+</div>
+</div>
+              
+              
+
+<div id="jb-print-docs-body" class="onlyprint">
+    <h1>User</h1>
+    <!-- Table of contents -->
+    <div id="print-main-content">
+        <div id="jb-print-toc">
+            
+        </div>
+    </div>
+</div>
+
+              
+                
+<div id="searchbox"></div>
+                <article class="bd-article" role="main">
+                  
+  <section class="tex2jax_ignore mathjax_ignore" id="user">
+<h1>User<a class="headerlink" href="#user" title="Permalink to this headline">#</a></h1>
+<p>The <code class="docutils literal notranslate"><span class="pre">User</span></code> collection stores information about Reddit users. Each document in this collection has the following schema:</p>
+<div class="highlight-python notranslate"><div class="highlight"><pre><span></span><span class="p">{</span>
+    <span class="s2">&quot;redditor_id&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Unique identifier for the user</span>
+    <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># User&#39;s Reddit username</span>
+    <span class="s2">&quot;created_at&quot;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>  <span class="c1"># Datetime when the user account was created (ISO format)</span>
+    <span class="s2">&quot;karma&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="s2">&quot;link&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Link karma</span>
+        <span class="s2">&quot;total&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Total karma</span>
+        <span class="s2">&quot;awardee&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Karma received from awards</span>
+        <span class="s2">&quot;awarder&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># Karma awarded to others</span>
+        <span class="s2">&quot;comment&quot;</span><span class="p">:</span> <span class="nb">int</span>  <span class="c1"># Comment karma</span>
+    <span class="p">},</span>
+    <span class="s2">&quot;is_gold&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>  <span class="c1"># Whether the user has Reddit Gold</span>
+    <span class="s2">&quot;is_mod&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="nb">str</span><span class="p">:</span> <span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span>  <span class="c1"># Dictionary mapping subreddit IDs to [subreddit name, number of subscribers]</span>
+    <span class="p">}</span> <span class="ow">or</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># None if the user is not a moderator</span>
+    <span class="s2">&quot;trophy&quot;</span><span class="p">:</span> <span class="p">{</span>
+        <span class="s2">&quot;list&quot;</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>  <span class="c1"># List of trophy names</span>
+        <span class="s2">&quot;count&quot;</span><span class="p">:</span> <span class="nb">int</span>  <span class="c1"># Number of trophies</span>
+    <span class="p">}</span> <span class="ow">or</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># None if the user has no trophies</span>
+    <span class="s2">&quot;removed&quot;</span><span class="p">:</span> <span class="nb">str</span>  <span class="c1"># &quot;active&quot; or &quot;suspended&quot;</span>
+<span class="p">}</span>
+</pre></div>
+</div>
+<p>Note: For suspended users, the <code class="docutils literal notranslate"><span class="pre">redditor_id</span></code> is represented as <code class="docutils literal notranslate"><span class="pre">&quot;suspended:{name}&quot;</span></code>.</p>
+</section>
+
+    <script type="text/x-thebe-config">
+    {
+        requestKernel: true,
+        binderOptions: {
+            repo: "binder-examples/jupyter-stacks-datascience",
+            ref: "master",
+        },
+        codeMirrorConfig: {
+            theme: "abcdef",
+            mode: "python"
+        },
+        kernelOptions: {
+            name: "python3",
+            path: "./data_schema"
+        },
+        predefinedOutput: true
+    }
+    </script>
+    <script>kernelName = 'python3'</script>
+
+                </article>
+              
+
+              
+              
+                <footer class="bd-footer-article">
+                  
+<div class="footer-article-items footer-article__inner">
+  
+    <div class="footer-article-item"><!-- Previous / next buttons -->
+<div class="prev-next-area">
+    <a class="left-prev"
+       href="../getting_started/setting.html"
+       title="previous page">
+      <i class="fa-solid fa-angle-left"></i>
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">previous</p>
+        <p class="prev-next-title">Getting Started</p>
+      </div>
+    </a>
+    <a class="right-next"
+       href="submission.html"
+       title="next page">
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">next</p>
+        <p class="prev-next-title">Submission</p>
+      </div>
+      <i class="fa-solid fa-angle-right"></i>
+    </a>
+</div></div>
+  
+</div>
+
+                </footer>
+              
+            </div>
+            
+            
+              
+            
+          </div>
+          <footer class="bd-footer-content">
+            
+<div class="bd-footer-content__inner container">
+  
+  <div class="footer-item">
+    
+<p class="component-author">
+By socius
+</p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  <p class="copyright">
+    
+      © Copyright 2024.
+      <br/>
+    
+  </p>
+
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+  <div class="footer-item">
+    
+  </div>
+  
+</div>
+          </footer>
+        
+
+      </main>
+    </div>
+  </div>
+  
+  <!-- Scripts loaded after <body> so the DOM is not blocked -->
+  <script src="../_static/scripts/bootstrap.js?digest=e353d410970836974a52"></script>
+<script src="../_static/scripts/pydata-sphinx-theme.js?digest=e353d410970836974a52"></script>
+
+  <footer class="bd-footer">
+  </footer>
+  </body>
+</html>
\ No newline at end of file
diff --git a/genindex.html b/genindex.html
index 2c880f9..d56c4be 100755
--- a/genindex.html
+++ b/genindex.html
@@ -8,7 +8,7 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>Index &#8212; ICWSM 2024 Tutorial</title>
+    <title>Index &#8212; RedditHarbor</title>
   
   
   
@@ -61,6 +61,7 @@
     <script async="async" src="_static/sphinx-thebe.js"></script>
     <script>DOCUMENTATION_OPTIONS.pagename = 'genindex';</script>
     <link rel="shortcut icon" href="_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="about.html" />
     <link rel="index" title="Index" href="#" />
     <link rel="search" title="Search" href="search.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
@@ -128,7 +129,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="Introduction.html">
+<a class="navbar-brand logo" href="about.html">
   
   
   
@@ -148,27 +149,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="Introduction.html">
+                <a class="reference internal" href="about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="pages/prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="pages/ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="pages/subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pages/download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
diff --git a/pages/install.html b/getting_started/installation.html
similarity index 84%
rename from pages/install.html
rename to getting_started/installation.html
index ef99d66..271e0e0 100755
--- a/pages/install.html
+++ b/getting_started/installation.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Installation &#8212; ICWSM 2024 Tutorial</title>
+    <title>Installation &#8212; RedditHarbor</title>
   
   
   
@@ -60,11 +60,12 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/install';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'getting_started/installation';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Getting Started" href="GettingStarted.html" />
+    <link rel="next" title="Getting Started" href="setting.html" />
     <link rel="prev" title="Prerequisites" href="prerequisites.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,7 +152,7 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
@@ -160,18 +161,24 @@
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/install.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fgetting_started/installation.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/install.md" target="_blank"
+      <li><a href="../_sources/getting_started/installation.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -393,7 +400,7 @@ <h1>Installation<a class="headerlink" href="#installation" title="Permalink to t
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./getting_started"
         },
         predefinedOutput: true
     }
@@ -421,7 +428,7 @@ <h1>Installation<a class="headerlink" href="#installation" title="Permalink to t
       </div>
     </a>
     <a class="right-next"
-       href="GettingStarted.html"
+       href="setting.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/prerequisites.html b/getting_started/prerequisites.html
similarity index 88%
rename from pages/prerequisites.html
rename to getting_started/prerequisites.html
index a7d4d99..f151a44 100755
--- a/pages/prerequisites.html
+++ b/getting_started/prerequisites.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Prerequisites &#8212; ICWSM 2024 Tutorial</title>
+    <title>Prerequisites &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/prerequisites';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'getting_started/prerequisites';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Installation" href="install.html" />
-    <link rel="prev" title="About" href="../Introduction.html" />
+    <link rel="next" title="Installation" href="installation.html" />
+    <link rel="prev" title="About" href="../about.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,7 +152,7 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
@@ -159,19 +160,25 @@
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/prerequisites.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fgetting_started/prerequisites.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/prerequisites.md" target="_blank"
+      <li><a href="../_sources/getting_started/prerequisites.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -455,7 +462,7 @@ <h2>🔣 Command Prompt (Windows Users)<a class="headerlink" href="#command-prom
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./getting_started"
         },
         predefinedOutput: true
     }
@@ -474,7 +481,7 @@ <h2>🔣 Command Prompt (Windows Users)<a class="headerlink" href="#command-prom
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="../Introduction.html"
+       href="../about.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -483,7 +490,7 @@ <h2>🔣 Command Prompt (Windows Users)<a class="headerlink" href="#command-prom
       </div>
     </a>
     <a class="right-next"
-       href="install.html"
+       href="installation.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/GettingStarted.html b/getting_started/setting.html
similarity index 89%
rename from pages/GettingStarted.html
rename to getting_started/setting.html
index 9a6a624..72dd48a 100755
--- a/pages/GettingStarted.html
+++ b/getting_started/setting.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Getting Started &#8212; ICWSM 2024 Tutorial</title>
+    <title>Getting Started &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/GettingStarted';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'getting_started/setting';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Scraping Examples" href="ScrapingExamples.html" />
-    <link rel="prev" title="Installation" href="install.html" />
+    <link rel="next" title="User" href="../data_schema/user.html" />
+    <link rel="prev" title="Installation" href="installation.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,7 +152,7 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
@@ -159,19 +160,25 @@
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="installation.html">Installation</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Getting Started</a></li>
 </ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
+</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="../hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/GettingStarted.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fgetting_started/setting.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/GettingStarted.md" target="_blank"
+      <li><a href="../_sources/getting_started/setting.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -445,7 +452,7 @@ <h2>Setting Up Supabase Tables<a class="headerlink" href="#setting-up-supabase-t
 <span class="k">ALTER</span><span class="w"> </span><span class="k">TABLE</span><span class="w"> </span><span class="n">test_comment</span><span class="w"> </span><span class="n">ENABLE</span><span class="w"> </span><span class="k">ROW</span><span class="w"> </span><span class="k">LEVEL</span><span class="w"> </span><span class="k">SECURITY</span><span class="p">;</span>
 </pre></div>
 </div>
-<p>This will create the three tables with the necessary columns and data types. Once created, you’ll see the new tables available in the “Table Editor”. In the future, you can duplicate and rename these tables (instead of “test_…”) for your production needs.</p>
+<p>This will create the three tables with the necessary columns and data types. Once created, you’ll see the new tables available in the “Table Editor”. In the future, you can duplicate and rename these tables (instead of “test_…”) for your production needs. For a structured overview of the database schema used by RedditHarbor, including detailed explanations of each field and its data type, see <a class="reference internal" href="../data_schema/user.html"><span class="doc std std-doc">Database Schema</span></a>.</p>
 <div class="admonition warning">
 <p class="admonition-title">Warning</p>
 <p>The RedditHarbor package depends on predefined column names for all user, submission, and comment tables. To ensure proper functionality, it’s crucial to create tables with all the specified columns mentioned in the documentation. Failure to do so may lead to errors or incomplete data retrieval.</p>
@@ -498,7 +505,7 @@ <h2>Setting Up for Data Collection<a class="headerlink" href="#setting-up-for-da
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./getting_started"
         },
         predefinedOutput: true
     }
@@ -517,7 +524,7 @@ <h2>Setting Up for Data Collection<a class="headerlink" href="#setting-up-for-da
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="install.html"
+       href="installation.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -526,11 +533,11 @@ <h2>Setting Up for Data Collection<a class="headerlink" href="#setting-up-for-da
       </div>
     </a>
     <a class="right-next"
-       href="ScrapingExamples.html"
+       href="../data_schema/user.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Scraping Examples</p>
+        <p class="prev-next-title">User</p>
       </div>
       <i class="fa-solid fa-angle-right"></i>
     </a>
diff --git a/pages/database.html b/hands_on/database_driven.html
similarity index 89%
rename from pages/database.html
rename to hands_on/database_driven.html
index 50fc127..805356d 100755
--- a/pages/database.html
+++ b/hands_on/database_driven.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Database-Driven Data Collection &#8212; ICWSM 2024 Tutorial</title>
+    <title>Database-Driven Data Collection &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/database';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/database_driven';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Downloading Data" href="download.html" />
-    <link rel="prev" title="Collecting Keyword-based Data" href="keyword.html" />
+    <link rel="next" title="Downloading Data" href="download_data.html" />
+    <link rel="prev" title="Collecting Keyword-based Data" href="keyword_based.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,27 +152,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l1 current active has-children"><a class="reference internal" href="scraping_examples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="keyword_based.html">Collecting Keyword-based Data</a></li>
 <li class="toctree-l2 current active"><a class="current reference internal" href="#">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/database.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/database_driven.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/database.md" target="_blank"
+      <li><a href="../_sources/hands_on/database_driven.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -434,7 +441,7 @@ <h2>Collect User Comments<a class="headerlink" href="#collect-user-comments" tit
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -453,7 +460,7 @@ <h2>Collect User Comments<a class="headerlink" href="#collect-user-comments" tit
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="keyword.html"
+       href="keyword_based.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -462,7 +469,7 @@ <h2>Collect User Comments<a class="headerlink" href="#collect-user-comments" tit
       </div>
     </a>
     <a class="right-next"
-       href="download.html"
+       href="download_data.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/download.html b/hands_on/download_data.html
similarity index 89%
rename from pages/download.html
rename to hands_on/download_data.html
index cd8ca76..6221a6e 100755
--- a/pages/download.html
+++ b/hands_on/download_data.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Downloading Data &#8212; ICWSM 2024 Tutorial</title>
+    <title>Downloading Data &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/download';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/download_data';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Updating Data" href="update.html" />
-    <link rel="prev" title="Database-Driven Data Collection" href="database.html" />
+    <link rel="next" title="Updating Data" href="update_data.html" />
+    <link rel="prev" title="Database-Driven Data Collection" href="database_driven.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,27 +152,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/download.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/download_data.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/download.md" target="_blank"
+      <li><a href="../_sources/hands_on/download_data.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -442,7 +449,7 @@ <h2>Downloading User Data<a class="headerlink" href="#downloading-user-data" tit
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -461,7 +468,7 @@ <h2>Downloading User Data<a class="headerlink" href="#downloading-user-data" tit
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="database.html"
+       href="database_driven.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -470,7 +477,7 @@ <h2>Downloading User Data<a class="headerlink" href="#downloading-user-data" tit
       </div>
     </a>
     <a class="right-next"
-       href="update.html"
+       href="update_data.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/keyword.html b/hands_on/keyword_based.html
similarity index 88%
rename from pages/keyword.html
rename to hands_on/keyword_based.html
index 712ab5b..ea0638d 100755
--- a/pages/keyword.html
+++ b/hands_on/keyword_based.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Collecting Keyword-based Data &#8212; ICWSM 2024 Tutorial</title>
+    <title>Collecting Keyword-based Data &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/keyword';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/keyword_based';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Database-Driven Data Collection" href="database.html" />
-    <link rel="prev" title="Collecting Subreddit-based Data" href="subreddit.html" />
+    <link rel="next" title="Database-Driven Data Collection" href="database_driven.html" />
+    <link rel="prev" title="Collecting Subreddit-based Data" href="subreddit_based.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,27 +152,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l1 current active has-children"><a class="reference internal" href="scraping_examples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="subreddit_based.html">Collecting Subreddit-based Data</a></li>
 <li class="toctree-l2 current active"><a class="current reference internal" href="#">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l2"><a class="reference internal" href="database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/keyword.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/keyword_based.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/keyword.md" target="_blank"
+      <li><a href="../_sources/hands_on/keyword_based.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -427,7 +434,7 @@ <h2>Collect Comments<a class="headerlink" href="#collect-comments" title="Permal
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -446,7 +453,7 @@ <h2>Collect Comments<a class="headerlink" href="#collect-comments" title="Permal
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="subreddit.html"
+       href="subreddit_based.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -455,7 +462,7 @@ <h2>Collect Comments<a class="headerlink" href="#collect-comments" title="Permal
       </div>
     </a>
     <a class="right-next"
-       href="database.html"
+       href="database_driven.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/ScrapingExamples.html b/hands_on/scraping_examples.html
similarity index 82%
rename from pages/ScrapingExamples.html
rename to hands_on/scraping_examples.html
index de181d4..0933c7e 100755
--- a/pages/ScrapingExamples.html
+++ b/hands_on/scraping_examples.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Scraping Examples &#8212; ICWSM 2024 Tutorial</title>
+    <title>Scraping Examples &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/ScrapingExamples';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/scraping_examples';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Collecting Subreddit-based Data" href="subreddit.html" />
-    <link rel="prev" title="Getting Started" href="GettingStarted.html" />
+    <link rel="next" title="Collecting Subreddit-based Data" href="subreddit_based.html" />
+    <link rel="prev" title="Comment" href="../data_schema/comment.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,27 +152,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l2"><a class="reference internal" href="subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/ScrapingExamples.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/scraping_examples.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/ScrapingExamples.md" target="_blank"
+      <li><a href="../_sources/hands_on/scraping_examples.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -371,9 +378,9 @@ <h1>Scraping Examples</h1>
 <h1>Scraping Examples<a class="headerlink" href="#scraping-examples" title="Permalink to this headline">#</a></h1>
 <p>This section will cover frequently used scenarios from researchers for collecting Reddit data.</p>
 <ul class="simple">
-<li><p><a class="reference internal" href="subreddit.html"><span class="doc std std-doc">Collecting Subreddit-based Data</span></a>: Provides guidance on collecting data from specific subreddits</p></li>
-<li><p><a class="reference internal" href="keyword.html"><span class="doc std std-doc">Collecting Keyword-based Data</span></a>: Covers collecting submissions based on specific keywords</p></li>
-<li><p><a class="reference internal" href="database.html"><span class="doc std std-doc">Database-Driven Data Collection</span></a>: Explains how to leverage an existing database (previously collected Reddit data) to collect additional relevant data</p></li>
+<li><p><a class="reference internal" href="subreddit_based.html"><span class="doc std std-doc">Collecting Subreddit-based Data</span></a>: Provides guidance on collecting data from specific subreddits</p></li>
+<li><p><a class="reference internal" href="keyword_based.html"><span class="doc std std-doc">Collecting Keyword-based Data</span></a>: Covers collecting submissions based on specific keywords</p></li>
+<li><p><a class="reference internal" href="database_driven.html"><span class="doc std std-doc">Database-Driven Data Collection</span></a>: Explains how to leverage an existing database (previously collected Reddit data) to collect additional relevant data</p></li>
 </ul>
 <div class="toctree-wrapper compound">
 </div>
@@ -392,7 +399,7 @@ <h1>Scraping Examples<a class="headerlink" href="#scraping-examples" title="Perm
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -411,16 +418,16 @@ <h1>Scraping Examples<a class="headerlink" href="#scraping-examples" title="Perm
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="GettingStarted.html"
+       href="../data_schema/comment.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
         <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Getting Started</p>
+        <p class="prev-next-title">Comment</p>
       </div>
     </a>
     <a class="right-next"
-       href="subreddit.html"
+       href="subreddit_based.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/subreddit.html b/hands_on/subreddit_based.html
similarity index 89%
rename from pages/subreddit.html
rename to hands_on/subreddit_based.html
index 92b2605..5719cbc 100755
--- a/pages/subreddit.html
+++ b/hands_on/subreddit_based.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Collecting Subreddit-based Data &#8212; ICWSM 2024 Tutorial</title>
+    <title>Collecting Subreddit-based Data &#8212; RedditHarbor</title>
   
   
   
@@ -60,12 +60,13 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/subreddit';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/subreddit_based';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Collecting Keyword-based Data" href="keyword.html" />
-    <link rel="prev" title="Scraping Examples" href="ScrapingExamples.html" />
+    <link rel="next" title="Collecting Keyword-based Data" href="keyword_based.html" />
+    <link rel="prev" title="Scraping Examples" href="scraping_examples.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -131,7 +132,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -151,27 +152,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
+<li class="toctree-l1 current active has-children"><a class="reference internal" href="scraping_examples.html">Scraping Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
 <li class="toctree-l2 current active"><a class="current reference internal" href="#">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l2"><a class="reference internal" href="keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
@@ -243,7 +250,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/subreddit.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/subreddit_based.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -273,7 +280,7 @@
       
       
       
-      <li><a href="../_sources/pages/subreddit.md" target="_blank"
+      <li><a href="../_sources/hands_on/subreddit_based.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -436,7 +443,7 @@ <h2>Collect Submissions, Comments, and Users<a class="headerlink" href="#collect
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -455,7 +462,7 @@ <h2>Collect Submissions, Comments, and Users<a class="headerlink" href="#collect
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="ScrapingExamples.html"
+       href="scraping_examples.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -464,7 +471,7 @@ <h2>Collect Submissions, Comments, and Users<a class="headerlink" href="#collect
       </div>
     </a>
     <a class="right-next"
-       href="keyword.html"
+       href="keyword_based.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
diff --git a/pages/update.html b/hands_on/update_data.html
similarity index 85%
rename from pages/update.html
rename to hands_on/update_data.html
index d3e2f29..5e41196 100755
--- a/pages/update.html
+++ b/hands_on/update_data.html
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
 
-    <title>Updating Data &#8212; ICWSM 2024 Tutorial</title>
+    <title>Updating Data &#8212; RedditHarbor</title>
   
   
   
@@ -60,11 +60,12 @@
 const thebe_selector_output = ".output, .cell_output"
 </script>
     <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'pages/update';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'hands_on/update_data';</script>
     <link rel="shortcut icon" href="../_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="../about.html" />
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="prev" title="Downloading Data" href="download.html" />
+    <link rel="prev" title="Downloading Data" href="download_data.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="None"/>
   </head>
@@ -130,7 +131,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="../Introduction.html">
+<a class="navbar-brand logo" href="../about.html">
   
   
   
@@ -150,26 +151,32 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="../Introduction.html">
+                <a class="reference internal" href="../about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="download.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="download_data.html">Downloading Data</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Updating Data</a></li>
 </ul>
 
@@ -242,7 +249,7 @@
       
       
       
-      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fpages/update.html&body=Your%20issue%20content%20here." target="_blank"
+      <li><a href="https://github.com/socius-org/RedditHarbor/issues/new?title=Issue%20on%20page%20%2Fhands_on/update_data.html&body=Your%20issue%20content%20here." target="_blank"
    class="btn btn-sm btn-source-issues-button dropdown-item"
    title="Open an issue"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -272,7 +279,7 @@
       
       
       
-      <li><a href="../_sources/pages/update.md" target="_blank"
+      <li><a href="../_sources/hands_on/update_data.md" target="_blank"
    class="btn btn-sm btn-download-source-button dropdown-item"
    title="Download source file"
    data-bs-placement="left" data-bs-toggle="tooltip"
@@ -381,7 +388,7 @@ <h2> Contents </h2>
 <h1>Updating Data<a class="headerlink" href="#updating-data" title="Permalink to this headline">#</a></h1>
 <section id="unlock-temporal-insights-with-intelligent-updates">
 <h2>Unlock temporal insights 📈 with intelligent updates 🔄<a class="headerlink" href="#unlock-temporal-insights-with-intelligent-updates" title="Permalink to this headline">#</a></h2>
-<p><code class="docutils literal notranslate"><span class="pre">RedditHarbor</span></code>’s update module streamlines and automates the process of updating crucial metrics for existing submissions (comment and user is currently working-in-progress!). It provides flexibility and configurability to adjust update intervals and data sources. A key advantage of this update module is the ability to track how various metrics, such as the upvote ratio or score, change over time for specific posts. This capability sets RedditHarbor apart from many other Reddit database resources, such as PushShift or Academic Torrents, which typically provide a static “snapshot” of submissions and comments at a random point in time.</p>
+<p>The <code class="docutils literal notranslate"><span class="pre">update()</span></code> module streamlines and automates the process of updating crucial metrics for existing submissions (comment and user is currently working-in-progress!). It provides flexibility and configurability to adjust update intervals and data sources. A key advantage of this update module is the ability to track how various metrics, such as the upvote ratio or score, change over time for specific posts. This capability sets RedditHarbor apart from many other Reddit database resources, such as PushShift or Academic Torrents, which typically provide a static “snapshot” of submissions and comments at a random point in time.</p>
 </section>
 <section id="updating-submissions">
 <h2>Updating Submissions<a class="headerlink" href="#updating-submissions" title="Permalink to this headline">#</a></h2>
@@ -443,7 +450,7 @@ <h2>Updating Submissions<a class="headerlink" href="#updating-submissions" title
         },
         kernelOptions: {
             name: "python3",
-            path: "./pages"
+            path: "./hands_on"
         },
         predefinedOutput: true
     }
@@ -462,7 +469,7 @@ <h2>Updating Submissions<a class="headerlink" href="#updating-submissions" title
     <div class="footer-article-item"><!-- Previous / next buttons -->
 <div class="prev-next-area">
     <a class="left-prev"
-       href="download.html"
+       href="download_data.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
diff --git a/index.html b/index.html
index bdfe955..46a5dec 100755
--- a/index.html
+++ b/index.html
@@ -1 +1 @@
-<meta http-equiv="Refresh" content="0; url=Introduction.html" />
+<meta http-equiv="Refresh" content="0; url=about.html" />
diff --git a/objects.inv b/objects.inv
index f0cacd5..52c4772 100755
--- a/objects.inv
+++ b/objects.inv
@@ -2,6 +2,4 @@
 # Project: Python
 # Version: 
 # The remainder of this file is compressed using zlib.
-xڅS�N� ��+��j�z3�1�1i���LZ"Sw���2���xcޛy��F�3bP�<�GaV?�f��MxV�73V#h�\�\�{PkvBcf����L�ԉ����|�
-�R�r� ��J|�!�HJ���˕���k�͈j	e	&=����C���X��>9�z�ٳQ
-��&5s����Cj��V%*��#W*�&"=��]�OX.������-��z%��`8����X��"?����+�R��.1��ن�(�Qģ��z������k��~�ak=p7L��6E�&��G?;
\ No newline at end of file
+xڅ��N�0E����@�زC!��*U��I<j,�~���;N�I�y��{2���h�J���mY=����IQ>�c��Am�%lZ-%��?Ӧ�Y��Frk�VK��A����@ޢYB���©8����bР��A%�{<�s\j��8d��Ip7��ި�a{�<�ܡ]�fF���R��L��%���E��Z�M\gkf�/f?~�C�m�-cn��^v1��Q	���y�ԑ�I�3G����QV�o�Y\�n(�hԭ(��mk��;��^��ٲ+��$��I�p}c�1�V����ͽ����>��W<���v�f3/�?WC�B��y��M���vgׅw��-�i�<HZ�&�wp�����
\ No newline at end of file
diff --git a/search.html b/search.html
index 3058d51..ef261d6 100755
--- a/search.html
+++ b/search.html
@@ -7,7 +7,7 @@
 
   <head>
     <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><title>Search - ICWSM 2024 Tutorial</title>
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><title>Search - RedditHarbor</title>
   
   
   
@@ -63,6 +63,7 @@
   <script src="_static/language_data.js"></script>
   <script src="searchindex.js"></script>
     <link rel="shortcut icon" href="_static/socius_logo.png"/>
+    <link rel="author" title="About these documents" href="about.html" />
     <link rel="index" title="Index" href="genindex.html" />
     <link rel="search" title="Search" href="#" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
@@ -130,7 +131,7 @@
         <div class="sidebar-primary-item">
   
 
-<a class="navbar-brand logo" href="Introduction.html">
+<a class="navbar-brand logo" href="about.html">
   
   
   
@@ -150,27 +151,33 @@
         
         <ul class="nav bd-sidenav bd-sidenav__home-link">
             <li class="toctree-l1">
-                <a class="reference internal" href="Introduction.html">
+                <a class="reference internal" href="about.html">
                     About
                 </a>
             </li>
         </ul>
         <p aria-level="2" class="caption" role="heading"><span class="caption-text">Getting Started</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="pages/prerequisites.html">Prerequisites</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/install.html">Installation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/GettingStarted.html">Getting Started</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/prerequisites.html">Prerequisites</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="getting_started/setting.html">Getting Started</a></li>
+</ul>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Database Schema</span></p>
+<ul class="nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="data_schema/user.html">User</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/submission.html">Submission</a></li>
+<li class="toctree-l1"><a class="reference internal" href="data_schema/comment.html">Comment</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Hands-on RedditHarbor</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="pages/ScrapingExamples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="pages/subreddit.html">Collecting Subreddit-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/keyword.html">Collecting Keyword-based Data</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pages/database.html">Database-Driven Data Collection</a></li>
+<li class="toctree-l1 has-children"><a class="reference internal" href="hands_on/scraping_examples.html">Scraping Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/subreddit_based.html">Collecting Subreddit-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/keyword_based.html">Collecting Keyword-based Data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="hands_on/database_driven.html">Database-Driven Data Collection</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pages/download.html">Downloading Data</a></li>
-<li class="toctree-l1"><a class="reference internal" href="pages/update.html">Updating Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/download_data.html">Downloading Data</a></li>
+<li class="toctree-l1"><a class="reference internal" href="hands_on/update_data.html">Updating Data</a></li>
 </ul>
 
     </div>
diff --git a/searchindex.js b/searchindex.js
index fd841ae..37dcc07 100755
--- a/searchindex.js
+++ b/searchindex.js
@@ -1 +1 @@
-Search.setIndex({docnames:["Introduction","pages/GettingStarted","pages/ScrapingExamples","pages/database","pages/download","pages/install","pages/keyword","pages/prerequisites","pages/subreddit","pages/update"],envversion:{"sphinx.domains.c":2,"sphinx.domains.changeset":1,"sphinx.domains.citation":1,"sphinx.domains.cpp":4,"sphinx.domains.index":1,"sphinx.domains.javascript":2,"sphinx.domains.math":2,"sphinx.domains.python":3,"sphinx.domains.rst":2,"sphinx.domains.std":2,"sphinx.ext.intersphinx":1,"sphinxcontrib.bibtex":9,sphinx:56},filenames:["Introduction.md","pages\\GettingStarted.md","pages\\ScrapingExamples.md","pages\\database.md","pages\\download.md","pages\\install.md","pages\\keyword.md","pages\\prerequisites.md","pages\\subreddit.md","pages\\update.md"],objects:{},objnames:{},objtypes:{},terms:{"0":[8,9],"000":9,"001":9,"1":[8,9],"10":[3,9],"100":[3,9],"12":[8,9],"1hr":9,"2":[3,8],"3":9,"30":9,"36":9,"5":[6,8],"6":[8,9],"72":9,"boolean":[1,6],"class":1,"default":7,"do":1,"export":0,"function":[1,7],"import":[1,3,4,9],"new":[1,3,7],"public":1,"return":6,"static":[0,9],"true":8,"while":[0,3,8],A:9,AND:6,And:4,At:7,For:[1,6,8],If:[7,8],In:1,It:9,NOT:6,OR:6,The:[0,1,7,9],To:[0,1,3,4,5,6,7,8,9],With:0,abil:9,academ:9,academictorr:0,access:[0,7],account:7,actual:8,addit:2,addition:5,adher:[0,9],adjust:[0,7,9],advanc:0,advantag:[0,9],after:7,agent:1,ago:8,all:[1,3,4,6,7],allow:[0,7,9],along:8,alreadi:7,also:[4,6],alter:1,altern:7,an:[1,2],ani:[0,5,7,8],anon:1,anonymis:[0,5,8],apart:9,api:[1,6,9],app:7,appear:7,archiv:[1,9],associ:[4,8],attach:1,authent:[1,7],autom:9,automat:[0,8,9],avail:1,award:[0,1],base:[0,2,9],bash:7,beforehand:[],begin:5,best:7,block:1,bodi:1,both:6,brew:7,button:7,calcul:9,call:8,can:[1,3,4,6,7],cannot:3,capabl:9,caus:1,chang:9,choic:0,claus:6,clear:[],click:1,client:[1,9],code:[1,3,6,7],col:4,collect:[2,5],column:[1,4],com:7,command:0,comment:[0,1,9],comment_from_submiss:3,comment_from_us:3,comment_id:1,compli:0,comprehens:0,configur:[0,1,7,8,9],connect:[0,7],constraint:0,contain:[3,6],control:[0,6],controversi:3,copi:1,correspond:8,cost:8,count:0,cover:2,creat:[1,7],created_at:1,creation:1,credenti:7,crucial:[1,9],csv:0,ctrl:7,current:[6,9],custom:4,customis:[0,6],d:8,dai:9,dashboard:1,data:[2,5,7],databas:[1,2,7,8,9],dataset:0,date_tim:8,db_config:[1,3,4,9],db_name:3,defin:1,demonstr:3,depend:[1,5],depth:8,design:0,develop:7,differ:6,difficulti:7,directli:[0,1,3],directori:4,distinct:0,dock:[1,9],document:1,doe:6,don:7,download:[5,7],driven:2,duplic:1,durat:9,dure:7,e:[1,3,6],eas:0,easi:[],edit:[1,7],editor:[1,7],effici:0,effortless:0,effortlessli:0,either:6,email_address:8,empow:0,enabl:[0,1,5],encount:7,energi:[6,8],enjoy:7,ensur:[0,1,7],entir:[3,8],error:1,ethic:0,even:0,everi:9,everyon:7,exampl:[6,8],exclud:6,exist:[2,9],experi:7,explain:2,explor:6,extens:7,extract:4,failur:1,featur:6,fell:8,fetch:[3,8],fetch_submiss:3,fetch_us:3,file:[1,4],file_nam:4,file_path:4,first:[3,7],flair:1,flexibl:[0,9],flow:6,focu:0,focus:0,folder:[1,4],follow:[1,3,4,6,7,9],food:8,format:[0,1],fossil:6,frequent:2,friendli:7,from:[1,2,5,7,9],fuel:6,full:7,futur:1,g:[1,3,6],ga:6,gather:[0,3],gener:7,get:[6,7],git:7,go:8,grappl:0,group:6,guid:7,guidanc:2,handl:0,have:7,head:[1,7],headlin:8,here:[0,7],hesit:7,homebrew:7,hot:8,hottest:8,hour:9,how:[0,2,9],howev:[6,8],hurdl:0,icwsm:1,id:[3,7,9],ideal:7,identifi:[0,5,8],impos:9,inadvert:8,includ:[3,8],incomplet:1,inform:[0,5],initialis:1,instal:7,instanc:1,instead:[1,7],institut:1,instruct:[],integr:0,interest:3,interv:[0,9],intuit:0,irb:0,is_gold:1,is_mod:1,jpeg:0,jpg:4,json:0,jsonb:1,jupyt:[1,7],just:[4,8],karma:1,kei:[0,1,9],keyword:[2,3],larg:0,latest:[5,7],lead:1,learnpython:[6,8],least:6,less:0,level:[1,3,8],leverag:[0,2],like:[0,7,8],limit:[3,6,8,9],line:7,link_id:1,linux:7,ll:[1,3,6],logic:6,login:[1,9],londonschoolofeconom:1,maco:7,made:3,mai:[1,6,8],make:7,manag:[0,7],mani:9,marketplac:7,mask:8,mask_pii:8,match:[3,6],mention:1,metric:[0,9],microsoft:8,million:0,minut:9,modul:9,month:8,more:0,most:[3,6],multipl:6,name:[1,3,4],navig:7,necessari:[1,5,7],need:[0,1,3,7],next:[1,6,9],non:9,none:[3,8],note:7,notebook:[1,7],now:1,num_com:[1,9],number:[8,9],oauth:9,object:0,obscur:8,obtain:7,offer:0,oil:6,older:5,onc:[1,7],one:[6,7,8],onli:9,open:[1,7],oper:6,optimis:0,option:7,org:7,organis:0,other:[6,9],out:7,output:4,over:[0,7,9],packag:[1,5,7],page:7,pagin:0,paramet:0,parent_id:1,parenthes:6,part:6,parti:0,particular:[3,6],past:1,path:7,pce:8,per:9,permalink:1,person:[0,5,8],phone:8,pii:[0,5],pip:5,pipelin:[1,9],pleas:7,png:4,point:9,poll:1,popular:7,possibl:6,post:9,power:6,practic:0,praw:0,predefin:1,prefer:[0,7],present:[0,6],presidio:8,press:7,previous:2,primari:1,privaci:[0,8],private_kei:1,process:[0,7,9],product:1,profil:0,progress:9,project:[1,7],proper:1,protect:[0,8],provid:[2,6,7,9],public_kei:[1,7],purpos:1,pushshift:[0,9],py:1,python3:7,python:[1,6,7,8],qpm:9,queri:[1,6,9],question:7,r:[6,8],random:9,rather:0,ratio:[0,9],re:[1,7],reach:7,readi:[0,1],recent:3,recommend:[1,7],reddit:[1,2,6,9],reddit_cli:[1,9],reddit_publ:1,reddit_secret:1,reddit_user_ag:1,redditharbor:[1,3,4,5,6,7,9],redditor_id:1,regist:7,regularli:0,relev:[2,6],remov:1,renam:1,renew:6,repli:[3,8],requir:[0,6,7,8],research:[2,8],resourc:9,result:6,retriev:[0,1,8],rigor:8,row:[0,1,9],run:[1,5,7,8],s:[0,1,4,6,7,8,9],safeguard:0,save:[4,8],scalabl:0,scenario:2,schedule_task:9,scienc:6,score:[0,1,4,9],script:7,seamlessli:0,search:[6,7],secret:1,secret_kei:[1,7],section:[2,6,7],secur:[0,1],see:1,select:7,serv:1,service_rol:[1,7],set:[3,7,8,9],shift:7,sidebar:[1,7],sign:7,simpli:[4,8],size:0,smart:0,smooth:7,snapshot:[0,9],so:[1,8],some:8,sometim:6,sort_typ:[3,8],sourc:9,specif:[0,2,9],specifi:[1,3,4,6,8],spend:0,sql:1,step:[4,7,9],storag:0,store:[0,1,7,8],straightforward:4,streamlin:[0,9],studio:7,style:7,submiss:[0,1,2],submission_by_keyword:6,submission_from_us:3,submission_id:[1,3,4],subreddit:[1,2],subreddit_com:8,subreddit_submiss:8,subreddit_submission_and_com:8,supabas:9,supabase_cli:[1,3,4,9],supabase_kei:1,supabase_url:1,support:[6,7],sure:7,system:7,t:7,tabl:[4,8],tailor:0,task:9,technic:0,templat:1,tempor:0,termin:[5,7],test:1,test_:1,test_com:[1,9],test_redditor:[1,9],test_submiss:[1,9],text:1,than:[0,6],them:[1,8],thi:[1,2,3,4,5,6,7,8,9],third:0,thread:[3,8],three:1,through:0,time:[0,9],timestamptz:1,titl:[1,4],to_csv:4,to_img:4,to_json:4,tool:0,top:[3,8],torrent:9,track:[0,9],tri:[],trophi:1,tutori:[1,7],type:1,typic:9,u:1,unexpect:6,unfortun:6,up:[3,7,8],updat:0,upgrad:5,upvot:[0,9],upvote_ratio:[1,9],url:[1,7],us:[1,2,3,4,5,6,7,8],user:[0,1,9],user_ag:1,usernam:1,util:[3,4,7],varchar:1,variou:9,veri:6,version:[5,7],visit:7,visual:7,wa:8,want:[0,8],we:[1,6,7],when:6,which:[1,6,7,9],who:0,without:6,wizard:7,word:6,work:9,workspac:7,wrestl:0,x:7,year:8,you:[1,3,6,7],your:[0,1,4,5,7,8]},titles:["About","Getting Started","Scraping Examples","Database-Driven Data Collection","Downloading Data","Installation","Collecting Keyword-based Data","Prerequisites","Collecting Subreddit-based Data","Updating Data"],titleterms:{It:0,about:0,activ:3,addit:3,analysi:0,api:[0,7],background:0,base:[6,8],build:0,can:0,code:0,collect:[0,1,3,6,8],command:7,comment:[3,4,6,8],complex:0,csv:4,data:[0,1,3,4,6,8,9],databas:[0,3],daunt:0,desir:6,download:4,driven:3,easili:0,entiti:8,environ:7,especi:0,etl:0,even:4,exampl:2,exist:3,extract:0,format:4,from:[3,4,6,8],get:1,harbor:0,imag:4,inform:8,insight:9,instal:5,intellig:9,interest:8,json:4,keyword:6,let:0,leverag:3,limit:0,load:0,navig:0,need:4,overview:0,pii:8,prerequisit:7,progress:[],prompt:7,re:8,reddit:[0,7],redditharbor:0,relev:3,remov:0,research:0,save:0,scrape:2,seamlessli:4,set:1,setup:7,simplifi:0,specif:[3,6,8],start:1,submiss:[3,4,6,8,9],subreddit:[6,8],supabas:[1,7],support:8,tabl:1,task:0,tempor:9,text:4,transform:0,unlock:9,up:1,updat:9,user:[3,4,7,8],whether:8,window:7,work:0,you:[0,4,8],your:[3,6]}})
\ No newline at end of file
+Search.setIndex({docnames:["about","data_schema/comment","data_schema/submission","data_schema/user","getting_started/installation","getting_started/prerequisites","getting_started/setting","hands_on/database_driven","hands_on/download_data","hands_on/keyword_based","hands_on/scraping_examples","hands_on/subreddit_based","hands_on/update_data"],envversion:{"sphinx.domains.c":2,"sphinx.domains.changeset":1,"sphinx.domains.citation":1,"sphinx.domains.cpp":4,"sphinx.domains.index":1,"sphinx.domains.javascript":2,"sphinx.domains.math":2,"sphinx.domains.python":3,"sphinx.domains.rst":2,"sphinx.domains.std":2,"sphinx.ext.intersphinx":1,"sphinxcontrib.bibtex":9,sphinx:56},filenames:["about.md","data_schema\\comment.md","data_schema\\submission.md","data_schema\\user.md","getting_started\\installation.md","getting_started\\prerequisites.md","getting_started\\setting.md","hands_on\\database_driven.md","hands_on\\download_data.md","hands_on\\keyword_based.md","hands_on\\scraping_examples.md","hands_on\\subreddit_based.md","hands_on\\update_data.md"],objects:{},objnames:{},objtypes:{},terms:{"0":[11,12],"000":12,"001":12,"1":[11,12],"10":[7,12],"100":[7,12],"12":[11,12],"1hr":12,"2":[7,11],"3":12,"30":12,"36":12,"5":[9,11],"6":[11,12],"72":12,"boolean":[6,9],"case":[],"class":6,"default":5,"do":6,"export":0,"float":2,"function":[5,6],"import":[6,7,8,12],"int":[1,2,3],"new":[5,6,7],"public":6,"return":9,"static":[0,12],"true":11,"while":[0,7,11],A:12,AND:9,And:8,At:5,For:[3,6,9,11],If:[1,5,11],In:6,It:12,NOT:9,OR:9,The:[0,1,2,3,5,6,12],To:[0,4,5,6,7,8,9,11,12],With:0,abil:12,about:[1,2,3],academ:12,academictorr:0,access:[0,5],account:[3,5],activ:3,actual:11,addit:10,addition:4,adher:[0,12],adjust:[0,5,12],advanc:0,advantag:[0,12],after:5,agent:6,ago:11,all:[2,5,6,7,8,9],allow:[0,5,12],along:11,alreadi:5,also:[8,9],alter:6,altern:5,an:[6,10],ani:[0,4,5,11],anon:6,anonymis:[0,4,11],anoth:1,apart:12,api:[6,9,12],app:5,appear:5,archiv:[2,6,12],associ:[1,8,11],attach:[2,6],authent:[5,6],author:2,autom:12,automat:[0,11,12],avail:6,award:[0,2,3,6],awarde:3,base:[0,10,12],bash:5,been:[1,2],begin:4,best:5,block:6,bodi:[1,6],bool:[1,2,3],both:9,brew:5,button:5,calcul:12,call:11,can:[1,5,6,7,8,9],cannot:7,capabl:12,caus:6,chang:12,choic:0,claus:9,click:6,client:[6,12],close:2,code:[5,6,7,9],coin:2,coin_pric:2,col:8,collect:[1,2,3,4,10],column:[6,8],com:[2,5],command:0,comment:[0,2,3,6,12],comment_from_submiss:7,comment_from_us:7,comment_id:[1,6],compli:0,comprehens:0,configur:[0,5,6,11,12],connect:[0,5],constraint:0,contain:[2,7,9],content:[1,2],control:[0,9],controversi:7,copi:6,correspond:11,cost:11,count:[0,2,3],cover:10,creat:[1,2,3,5,6],created_at:[1,2,3,6],creation:6,credenti:5,crucial:[6,12],csv:0,ctrl:5,current:[9,12],custom:8,customis:[0,9],d:11,dai:12,dashboard:6,data:[4,5,10],databas:[5,6,10,11,12],dataset:0,date_tim:11,datetim:[1,2,3],db_config:[6,7,8,12],db_name:7,defin:6,delet:1,demonstr:7,depend:[4,6],depth:11,design:0,detail:6,develop:5,dict:2,dictionari:[1,2,3],differ:[1,9],difficulti:5,directli:[0,6,7],directori:8,distinct:0,dock:[6,12],document:[1,2,3,6],doe:[2,9],don:5,download:[4,5],driven:10,duplic:6,durat:12,dure:5,e:[2,6,7,9],each:[1,2,3,6],eas:0,edit:[1,2,5,6],editor:[5,6],effici:0,effortless:0,effortlessli:0,either:9,email_address:11,empow:0,enabl:[0,4,6],encount:5,end:2,energi:[9,11],enjoy:5,ensur:[0,5,6],entir:[7,11],error:6,ethic:0,even:0,everi:12,everyon:5,exampl:[2,9,11],exclud:9,exist:[10,12],experi:5,explain:10,explan:6,explor:9,extens:5,extract:8,failur:6,featur:9,fell:11,fetch:[7,11],fetch_submiss:7,fetch_us:7,field:[1,6],file:[6,8],file_nam:8,file_path:8,first:[5,7],flair:[2,6],flexibl:[0,12],flow:9,focu:0,focus:0,folder:[6,8],follow:[1,2,3,5,6,7,8,9,12],food:11,format:[0,1,2,3,6],fossil:9,frequent:10,friendli:5,from:[3,4,5,6,10,12],fuel:9,full:5,futur:6,g:[2,6,7,9],ga:9,gather:[0,7],gener:5,get:[5,9],git:5,go:11,gold:3,grappl:0,group:9,guid:5,guidanc:10,ha:[1,2,3],handl:0,have:[1,2,5],head:[5,6],headlin:11,here:[0,5],hesit:5,homebrew:5,hot:11,hottest:11,hour:12,how:[0,10,12],howev:[9,11],http:2,hurdl:0,i:[],icwsm:6,id:[1,2,3,5,7,12],ideal:5,identifi:[0,1,2,3,4,11],ii:[],imag:2,impos:12,inadvert:11,includ:[6,7,11],incomplet:6,inform:[0,1,2,3,4],initialis:6,instal:5,instanc:6,instead:[5,6],institut:6,integr:0,interest:7,interv:[0,12],intuit:0,irb:0,is_gold:[3,6],is_mod:[3,6],iso:[1,2,3],its:6,jpeg:0,jpg:[2,8],json:0,jsonb:6,jupyt:[5,6],just:[8,11],karma:[3,6],kei:[0,6,12],keyword:[7,10],larg:0,latest:[4,5],lead:6,learnpython:[9,11],least:9,less:0,level:[1,6,7,11],leverag:[0,10],like:[0,5,11],limit:[7,9,11,12],line:5,link:[2,3],link_id:[1,6],linux:5,list:[2,3],ll:[6,7,9],logic:9,login:[6,12],londonschoolofeconom:6,maco:5,made:[1,7],mai:[6,9,11],make:5,manag:[0,5],mani:12,map:[1,2,3],marketplac:5,mask:11,mask_pii:11,match:[7,9],mean:1,media:2,mention:6,metric:[0,12],microsoft:11,million:0,minut:12,moder:3,modul:12,month:11,more:0,most:[7,9],multipl:9,name:[1,2,3,6,7,8],navig:5,necessari:[4,5,6],need:[0,5,6,7],next:[6,9,12],non:12,none:[1,2,3,7,11],note:[3,5],notebook:[5,6],now:6,num_com:[2,6,12],number:[2,3,11,12],oauth:12,object:0,obscur:11,obtain:5,offer:0,oil:9,older:4,onc:[5,6],one:[5,9,11],onli:12,open:[5,6],oper:9,optimis:0,option:[2,5],org:5,organis:0,other:[3,9,12],otherwis:1,out:5,output:8,over:[0,5,12],overview:6,packag:[4,5,6],page:5,pagin:0,paramet:0,parent:1,parent_id:[1,6],parenthes:9,part:9,parti:0,particular:[7,9],past:6,path:5,pce:11,per:12,permalink:[2,6],person:[0,4,11],phone:11,pii:[0,4],pip:4,pipelin:[6,12],pleas:5,png:8,point:12,poll:[2,6],popular:5,possibl:9,post:[1,2,12],power:9,practic:0,praw:0,predefin:6,prefer:[0,5],present:[0,9],presidio:11,press:5,previous:10,price:2,primari:6,privaci:[0,11],private_kei:6,process:[0,5,12],product:6,profil:0,progress:12,project:[5,6],proper:6,protect:[0,11],provid:[5,9,10,12],public_kei:[5,6],purpos:6,pushshift:[0,12],py:6,python3:5,python:[5,6,9,11],qpm:12,queri:[6,9,12],question:5,r:[9,11],random:12,rather:0,ratio:[0,2,12],re:[5,6],reach:5,readi:[0,6],receiv:[2,3],recent:7,recommend:[5,6],reddit:[1,2,3,6,9,10,12],reddit_cli:[6,12],reddit_publ:6,reddit_secret:6,reddit_user_ag:6,redditharbor:[4,5,6,7,8,9,12],redditor:[],redditor_id:[1,2,3,6],regist:5,regularli:0,relev:[9,10],remov:[1,2,3,6],renam:6,renew:9,repli:[1,7,11],repres:3,requir:[0,5,9,11],research:[10,11],resourc:12,result:9,retriev:[0,6,11],rigor:11,row:[0,6,12],run:[4,5,6,11],s:[0,1,2,3,5,6,8,9,11],safeguard:0,save:[8,11],scalabl:0,scenario:10,schedule_task:12,schema:[1,2,3,6],scienc:9,score:[0,1,2,6,8,12],script:5,seamlessli:0,search:[5,9],secret:6,secret_kei:[5,6],section:[5,9,10],secur:[0,6],see:6,select:5,selftext:[],serv:6,service_rol:[5,6],set:[5,7,11,12],shift:5,sidebar:[5,6],sign:5,simpl:[],simpli:[8,11],size:0,smart:0,smooth:5,snapshot:[0,12],so:[6,11],some:11,sometim:9,sort_typ:[7,11],sourc:12,specif:[0,10,12],specifi:[1,6,7,8,9,11],spend:0,sql:6,start:1,step:[5,8,12],storag:0,store:[0,1,2,3,5,6,11],str:[1,2,3],straightforward:8,streamlin:[0,12],structur:6,studio:5,style:5,submiss:[0,1,6,10],submission_by_keyword:9,submission_from_us:7,submission_id:[2,6,7,8],subreddit:[1,2,3,6,10],subreddit_com:11,subreddit_submiss:11,subreddit_submission_and_com:11,subscrib:3,supabas:12,supabase_cli:[6,7,8,12],supabase_kei:6,supabase_url:6,support:[5,9],sure:5,suspend:3,system:5,t1_:1,t3_:1,t:5,tabl:[8,11],tailor:0,task:12,technic:0,templat:6,tempor:0,termin:[4,5],test:6,test_:6,test_com:[6,12],test_redditor:[6,12],test_submiss:[6,12],text:[1,2,6],than:[0,9],them:[6,11],thi:[1,2,3,4,5,6,7,8,9,10,11,12],third:0,thread:[7,11],three:6,through:0,time:[0,12],timestamptz:6,titl:[2,6,8],to_csv:8,to_img:8,to_json:8,tool:0,top:[1,7,11],torrent:12,total:[2,3],total_awards_count:2,total_awards_pric:2,total_vote_count:2,track:[0,12],trophi:[3,6],tutori:[5,6],two:1,type:6,typic:12,u:6,unexpect:9,unfortun:9,uniqu:[1,2,3],up:[5,7,11],updat:0,upgrad:4,upvot:[0,2,12],upvote_ratio:[2,6,12],url:[2,5,6],us:[4,5,6,7,8,9,10,11],user:[0,1,2,6,12],user_ag:6,usernam:[3,6],util:[5,7,8],varchar:6,variou:12,veri:9,version:[4,5],visit:5,visual:5,vote:2,vote_ends_at:2,wa:[1,2,3,11],want:[0,11],we:[5,6,9],when:[1,2,3,9],whether:[1,2,3],which:[5,6,9,12],who:[0,1,2],without:9,wizard:5,word:9,work:12,workspac:5,wrestl:0,x:5,year:11,you:[5,6,7,9],your:[0,4,5,6,8,11]},titles:["About","Comment","Submission","User","Installation","Prerequisites","Getting Started","Database-Driven Data Collection","Downloading Data","Collecting Keyword-based Data","Scraping Examples","Collecting Subreddit-based Data","Updating Data"],titleterms:{It:0,about:0,activ:7,addit:7,analysi:0,api:[0,5],background:0,base:[9,11],build:0,can:0,code:0,collect:[0,6,7,9,11],command:5,comment:[1,7,8,9,11],complex:0,csv:8,data:[0,6,7,8,9,11,12],databas:[0,7],daunt:0,desir:9,download:8,driven:7,easili:0,entiti:11,environ:5,especi:0,etl:0,even:8,exampl:10,exist:7,extract:0,format:8,from:[7,8,9,11],get:6,harbor:0,imag:8,inform:11,insight:12,instal:4,intellig:12,interest:11,json:8,keyword:9,let:0,leverag:7,limit:0,load:0,navig:0,need:8,overview:0,pii:11,prerequisit:5,prompt:5,re:11,reddit:[0,5],redditharbor:0,relev:7,remov:0,research:0,save:0,scrape:10,seamlessli:8,set:6,setup:5,simplifi:0,specif:[7,9,11],start:6,submiss:[2,7,8,9,11,12],subreddit:[9,11],supabas:[5,6],support:11,tabl:6,task:0,tempor:12,text:8,transform:0,unlock:12,up:6,updat:12,user:[3,5,7,8,11],whether:11,window:5,work:0,you:[0,8,11],your:[7,9]}})
\ No newline at end of file