e-mission · humbleOldSage · Aug 11, 2023 · Aug 16, 2023 · shankari · Aug 11, 2023
diff --git a/emission/analysis/modelling/trip_model/greedy_similarity_binning.py b/emission/analysis/modelling/trip_model/greedy_similarity_binning.py
@@ -121,6 +121,7 @@ class label to apply:
         self.is_incremental = config['incremental_evaluation']
 
         self.bins: Dict[str, Dict] = {}
+        self.tripLabels=[]
 
 
     def fit(self, trips: List[ecwc.Confirmedtrip]):
@@ -184,9 +185,11 @@ def _assign_bins(self, trips: List[ecwc.Confirmedtrip]):
                 logging.debug(f"adding trip to bin {bin_id} with features {trip_features}")
                 self.bins[bin_id]['feature_rows'].append(trip_features)
                 self.bins[bin_id]['labels'].append(trip_labels)
+                self.tripLabels.append(bin_id)
             else:
                 # create new bin
                 new_bin_id = str(len(self.bins))
+                self.tripLabels.append(new_bin_id)
                 new_bin_record = {
                     'feature_rows': [trip_features],
                     'labels': [trip_labels],

diff --git a/emission/storage/timeseries/builtin_timeseries.py b/emission/storage/timeseries/builtin_timeseries.py
@@ -23,6 +23,9 @@
 INVALID_QUERY = {'metadata.key': 'invalid'}
 
 class BuiltinTimeSeries(esta.TimeSeries):
+
+    entryList=[]
+
     def __init__(self, user_id):
         super(BuiltinTimeSeries, self).__init__(user_id)
         self.key_query = lambda key: {"metadata.key": key}
@@ -261,6 +264,9 @@ def get_entry_at_ts(self, key, ts_key, ts):
         logging.debug("get_entry_at_ts result = %s" % retValue)
         return retValue
 
+    def getEntryList(self):
+        return self.entryList
+
     def get_data_df(self, key, time_query = None, geo_query = None,
                     extra_query_list=None,
                     map_fn = None):
@@ -290,7 +296,11 @@ def to_data_df(key, entry_it, map_fn = None):
         if map_fn is None:
             map_fn = BuiltinTimeSeries._to_df_entry
         # Dataframe doesn't like to work off an iterator - it wants everything in memory
-        df = pd.DataFrame([map_fn(e) for e in entry_it])
+
+        for e in entry_it:
+            BuiltinTimeSeries.entryList.append(map_fn(e)) 
+        df = pd.DataFrame(BuiltinTimeSeries.entryList)
+
         logging.debug("Found %s results" % len(df))
         if len(df) > 0:
             dedup_check_list = [item for item in ecwe.Entry.get_dedup_list(key)