Merge branch 'main' into fix/rosbag_to_non_annotated_t4/fix_non_initi…

…alized_variable
tier4 · Dec 13, 2023 · e22fec8 · e22fec8
2 parents 9011ab2 + 9c88581
commit e22fec8
Show file tree

Hide file tree

Showing 7 changed files with 315 additions and 8 deletions.
diff --git a/config/convert_annotated_t4_to_deepen_sample.yaml b/config/convert_annotated_t4_to_deepen_sample.yaml
@@ -0,0 +1,21 @@
+task: convert_annotated_t4_to_deepen
+conversion:
+  input_base: ./data/annotated_t4_format
+  output_base: ./data/deepen_format
+  annotation_hz: 10
+  workers_number: 12
+  label_only: False
+  camera_sensors:
+    - channel: CAM_FRONT
+    - channel: CAM_FRONT_RIGHT
+    - channel: CAM_BACK_RIGHT
+    - channel: CAM_BACK
+    - channel: CAM_BACK_LEFT
+    - channel: CAM_FRONT_LEFT
+  camera_position:
+    CAM_FRONT: camera_0
+    CAM_FRONT_RIGHT: camera_1
+    CAM_BACK_RIGHT: camera_2
+    CAM_BACK: camera_3
+    CAM_BACK_LEFT: camera_4
+    CAM_FRONT_LEFT: camera_5
diff --git a/config/convert_t4_to_deepen_sample.yaml → ...rt_non_annotated_t4_to_deepen_sample.yaml b/config/convert_t4_to_deepen_sample.yaml → ...rt_non_annotated_t4_to_deepen_sample.yaml
@@ -1,4 +1,4 @@
-task: convert_t4_to_deepen
+task: convert_non_annotated_t4_to_deepen
 conversion:
   input_base: ./data/non_annotated_t4_format
   output_base: ./data/deepen_format

diff --git a/docs/tools_overview.md b/docs/tools_overview.md
@@ -76,15 +76,15 @@ Execute the conversion command again with `--overwrite` option.
 
 ## Deepen
 
-### T4 format to Deepen format
+### Non-annotated T4 format to Deepen format
 
 Converts T4 format data to Deepen format.
 
-input: T4 format data  
+input: Non-annotated T4 format data  
 output: deepen-format data
 
 ```bash
-python -m perception_dataset.convert --config config/convert_t4_to_deepen_sample.yaml
+python -m perception_dataset.convert --config config/convert_non_annotated_t4_to_deepen_sample.yaml
 ```
 
 ### Create and update dataset
@@ -207,3 +207,15 @@ output: T4 format data
 ```bash
 python -m perception_dataset.convert --config config/rosbag2_to_t4/convert_pseudolabel_lidar.yaml
 ```
+
+### Annotated T4 format to Deepen format
+
+In case you may want to modify the annotation of the T4 format data, you can also convert the annotated T4 format data to Deepen format.
+NOTE: By default the conversion script will convert sensor data and annotation data, but you may change `label_only` to `true` in the config file to convert only the annotation data.
+
+input: Annotated T4 format data
+output: deepen-format data (sensor data and label data)
+
+```bash
+python -m perception_dataset.convert --config config/convert_annotated_t4_to_deepen_sample.yaml
+```
diff --git a/perception_dataset/convert.py b/perception_dataset/convert.py
@@ -62,7 +62,7 @@ def main():
         logger.info(
             f"[END] Converting Rosbag2 ({params.input_base}) to Non Annotated T4 data ({params.output_base})"
         )
-    elif task == "convert_t4_to_deepen":
+    elif task == "convert_non_annotated_t4_to_deepen":
         from perception_dataset.deepen.non_annotated_t4_to_deepen_converter import (
             NonAnnotatedT4ToDeepenConverter,
         )
@@ -88,6 +88,47 @@ def main():
         logger.info(
             f"[Done] Converting T4 dataset ({input_base}) to deepen format dataset ({output_base})"
         )
+    elif task == "convert_annotated_t4_to_deepen":
+        from perception_dataset.deepen.annotated_t4_to_deepen_converter import (
+            AnnotatedT4ToDeepenConverter,
+        )
+        from perception_dataset.deepen.non_annotated_t4_to_deepen_converter import (
+            NonAnnotatedT4ToDeepenConverter,
+        )
+
+        input_base = config_dict["conversion"]["input_base"]
+        output_base = config_dict["conversion"]["output_base"]
+        camera_sensors = config_dict["conversion"]["camera_sensors"]
+        annotation_hz = config_dict["conversion"]["annotation_hz"]
+        workers_number = config_dict["conversion"]["workers_number"]
+        camera_position = config_dict["conversion"]["camera_position"]
+        label_only = config_dict["conversion"]["label_only"]
+
+        converter = AnnotatedT4ToDeepenConverter(
+            input_base=input_base,
+            output_base=output_base,
+            camera_position=camera_position,
+        )
+
+        logger.info(
+            f"[BEGIN] Converting T4 dataset ({input_base}) to deepen format dataset ({output_base})"
+        )
+        converter.convert()
+
+        if not label_only:
+            converter_non_anno = NonAnnotatedT4ToDeepenConverter(
+                input_base=input_base,
+                output_base=output_base,
+                camera_sensors=camera_sensors,
+                annotation_hz=annotation_hz,
+                workers_number=workers_number,
+            )
+            converter_non_anno.convert()
+
+        logger.info(
+            f"[Done] Converting T4 dataset ({input_base}) to deepen format dataset ({output_base})"
+        )
+
     elif task == "convert_deepen_to_t4":
         from perception_dataset.deepen.deepen_to_t4_converter import DeepenToT4Converter
 

diff --git a/perception_dataset/deepen/annotated_t4_to_deepen_converter.py b/perception_dataset/deepen/annotated_t4_to_deepen_converter.py
@@ -0,0 +1,233 @@
+import glob
+import json
+import os
+import os.path as osp
+import time
+from typing import Any, Dict, List
+
+from nuimages import NuImages
+import numpy as np
+from nuscenes.nuscenes import NuScenes
+from nuscenes.utils.geometry_utils import transform_matrix
+from pyquaternion import Quaternion
+
+from perception_dataset.abstract_converter import AbstractConverter
+from perception_dataset.constants import LABEL_PATH_ENUM
+from perception_dataset.utils.label_converter import LabelConverter
+from perception_dataset.utils.logger import configure_logger
+
+logger = configure_logger(modname=__name__)
+
+
+class AnnotatedT4ToDeepenConverter(AbstractConverter):
+    def __init__(self, input_base: str, output_base: str, camera_position: Dict):
+        super().__init__(input_base, output_base)
+        self._camera_position = camera_position
+        self._label_converter = LabelConverter(
+            label_path=LABEL_PATH_ENUM.OBJECT_LABEL,
+            attribute_path=LABEL_PATH_ENUM.ATTRIBUTE,
+        )
+
+    def convert(self):
+        start_time = time.time()
+
+        for scene_dir in glob.glob(osp.join(self._input_base, "*")):
+            if not osp.isdir(scene_dir):
+                continue
+            t4_dataset_path = osp.join(scene_dir, "t4_dataset")
+            if not osp.isdir(t4_dataset_path):
+                t4_dataset_path = scene_dir
+
+            scene_name = osp.basename(scene_dir)
+            self._convert_one_scene(
+                t4_dataset_path,
+                scene_name,
+            )
+
+        elapsed_time = time.time() - start_time
+        logger.info(f"Elapsed time: {elapsed_time:.1f} [sec]")
+
+    def _convert_one_scene(self, input_dir: str, scene_name: str):
+        output_dir = self._output_base
+        os.makedirs(output_dir, exist_ok=True)
+        nusc = NuScenes(version="annotation", dataroot=input_dir, verbose=False)
+        nuim = NuImages(version="annotation", dataroot=input_dir, verbose=True, lazy=True)
+
+        logger.info(f"Converting {input_dir} to {output_dir}")
+        output_label: List = []
+
+        for frame_index, sample_record in enumerate(nusc.sample):
+            sample_token = sample_record["token"]
+            logger.info(f"sample_token: {sample_token}")
+            for anno_token in sample_record["anns"]:
+                current_label_dict: Dict = {}
+                current_label_dict["attributes_source"] = {}
+                current_label_dict["create_time_millis"] = "null"
+                current_label_dict["update_time_millis"] = "null"
+                current_label_dict["dataset_id"] = ""
+                current_label_dict["labeller_email"] = "[email protected]"
+                current_label_dict["user_id"] = "[email protected]"
+                current_label_dict["version"] = "null"
+                current_label_dict["label_set_id"] = "default"
+                current_label_dict["stage_id"] = "Labelling"
+                anno = nusc.get("sample_annotation", anno_token)
+
+                instance_record = nusc.get("instance", anno["instance_token"])
+                instance_index = nusc.getind("instance", anno["instance_token"]) + 1
+                category_record = nusc.get("category", instance_record["category_token"])
+                visibility_record = nusc.get("visibility", anno["visibility_token"])
+
+                for sensor, token in sample_record["data"].items():
+                    if "LIDAR" in sensor:
+                        break
+
+                sample_data_record = nusc.get("sample_data", sample_record["data"][sensor])
+                file_id = osp.basename(sample_data_record["filename"]).replace(".pcd.bin", ".pcd")
+                label_category_id = self._label_converter.convert_label(category_record["name"])
+
+                attributes_records = [
+                    nusc.get("attribute", token) for token in anno["attribute_tokens"]
+                ]
+                attributes_name = [
+                    self._label_converter.convert_attribute(v["name"]) for v in attributes_records
+                ]
+                attributes = {v[0 : v.find(".")]: v[v.find(".") + 1 :] for v in attributes_name}
+                if "occlusion_state" not in attributes:
+                    attributes["occlusion_state"] = self._convert_to_visibility_occulusion(
+                        visibility_record["level"]
+                    )
+
+                three_d_bbox = {
+                    "cx": anno["translation"][0],
+                    "cy": anno["translation"][1],
+                    "cz": anno["translation"][2],
+                    "h": anno["size"][2],
+                    "l": anno["size"][1],
+                    "w": anno["size"][0],
+                    "quaternion": {
+                        "x": anno["rotation"][1],
+                        "y": anno["rotation"][2],
+                        "z": anno["rotation"][3],
+                        "w": anno["rotation"][0],
+                    },
+                }
+                current_label_dict["three_d_bbox"] = three_d_bbox
+                sensor_id = "lidar"
+                label_type = "3d_bbox"
+
+                current_label_dict["attributes"] = attributes
+                current_label_dict["file_id"] = file_id
+                current_label_dict["label_category_id"] = label_category_id
+                current_label_dict["label_id"] = f"{label_category_id}:{instance_index}"
+                current_label_dict["sensor_id"] = sensor_id
+                current_label_dict["label_type"] = label_type
+
+                output_label.append(current_label_dict)
+                print(f"{label_category_id}:{instance_index}")
+
+        if osp.exists(osp.join(input_dir, "annotation", "object_ann.json")):
+            for frame_index, sample_record in enumerate(nusc.sample):
+                for cam, sensor_id in self._camera_position.items():
+                    if cam not in sample_record["data"]:
+                        continue
+                    sample_camera_token = sample_record["data"][cam]
+                    print(f"cam:{cam}, sample_camera_token: {sample_camera_token}")
+                    object_anns = [
+                        o for o in nuim.object_ann if o["sample_data_token"] == sample_camera_token
+                    ]
+
+                    for ann in object_anns:
+                        current_label_dict: Dict = {}
+                        category_token = ann["category_token"]
+                        category_record = nuim.get("category", category_token)
+                        bbox = ann["bbox"]
+                        bbox[2] = bbox[2] - bbox[0]
+                        bbox[3] = bbox[3] - bbox[1]
+                        label_type = "box"
+                        current_label_dict["box"] = bbox
+
+                        label_category_id = self._label_converter.convert_label(
+                            category_record["name"]
+                        )
+                        try:
+                            instance_index = nusc.getind("instance", ann["instance_token"]) + 1
+                            attributes_records = [
+                                nusc.get("attribute", token) for token in ann["attribute_tokens"]
+                            ]
+                            attributes_name = [
+                                self._label_converter.convert_attribute(v["name"])
+                                for v in attributes_records
+                            ]
+                            attributes = {
+                                v[0 : v.find(".")]: v[v.find(".") + 1 :] for v in attributes_name
+                            }
+
+                            current_label_dict["attributes"] = attributes
+                            current_label_dict["create_time_millis"] = "null"
+                            current_label_dict["update_time_millis"] = "null"
+                            current_label_dict["dataset_id"] = ""
+                            current_label_dict["labeller_email"] = "[email protected]"
+                            current_label_dict["user_id"] = "[email protected]"
+                            current_label_dict["version"] = "null"
+                            current_label_dict["label_set_id"] = "default"
+                            current_label_dict["stage_id"] = "Labelling"
+                            current_label_dict["file_id"] = f"{frame_index}.pcd"
+                            current_label_dict["label_category_id"] = label_category_id
+                            current_label_dict[
+                                "label_id"
+                            ] = f"{label_category_id}:{instance_index}"
+                            current_label_dict["sensor_id"] = sensor_id
+                            current_label_dict["label_type"] = label_type
+
+                            output_label.append(current_label_dict)
+                            print(f"{label_category_id}:{instance_index}")
+                        except KeyError:
+                            instance_id = ann["instance_token"]
+                            print(f"There is no instance_id:{instance_id}")
+
+        output_json = {"labels": output_label}
+        with open(osp.join(output_dir, f"{scene_name}.json"), "w") as f:
+            json.dump(output_json, f, indent=4)
+
+        logger.info(f"Done Conversion: {input_dir} to {output_dir}")
+
+    def _get_data(self, nusc: NuScenes, sensor_channel_token: str) -> Dict[str, Any]:
+        sd_record = nusc.get("sample_data", sensor_channel_token)
+        cs_record = nusc.get("calibrated_sensor", sd_record["calibrated_sensor_token"])
+        ep_record = nusc.get("ego_pose", sd_record["ego_pose_token"])
+
+        sensor2ego_transform = transform_matrix(
+            translation=cs_record["translation"],
+            rotation=Quaternion(cs_record["rotation"]),
+        )
+        ego2global_transform = transform_matrix(
+            translation=ep_record["translation"],
+            rotation=Quaternion(ep_record["rotation"]),
+        )
+
+        sensor2global_transform = ego2global_transform @ sensor2ego_transform
+        sensor2global_translation = sensor2global_transform[:3, 3]
+        sensor2global_rotation = np.array(list(Quaternion(matrix=sensor2global_transform[:3, :3])))
+
+        ret_dict = {
+            "fileformat": sd_record["fileformat"],
+            "unix_timestamp": self._timestamp_to_sec(sd_record["timestamp"]),
+            "sensor2global_transform": sensor2global_transform,
+            "sensor2global_translation": sensor2global_translation,
+            "sensor2global_rotation": sensor2global_rotation,
+        }
+
+        return ret_dict
+
+    def _timestamp_to_sec(self, timestamp: int) -> float:
+        return float(timestamp) * 1e-6
+
+    def _convert_to_visibility_occulusion(self, name: str) -> str:
+        if name == "none":
+            return "full"
+        elif name == "most":
+            return "partial"
+        elif name == "partial":
+            return "most"
+        else:
+            return "none"
diff --git a/tests/config/convert_t4_to_deepen.yaml → ...g/convert_non_annotated_t4_to_deepen.yaml b/tests/config/convert_t4_to_deepen.yaml → ...g/convert_non_annotated_t4_to_deepen.yaml
@@ -1,4 +1,4 @@
-task: convert_t4_to_deepen
+task: convert_non_annotated_t4_to_deepen
 conversion:
   input_base: ./data/non_annotated_t4_format
   output_base: ./data/deepen_format

diff --git a/tests/test_t4_dataset_conversion.py b/tests/test_t4_dataset_conversion.py
@@ -49,8 +49,8 @@ def t4_dataset_path(request):
     converter = Rosbag2ToNonAnnotatedT4Converter(converter_params)
     converter.convert()
 
-    # before test - convert t4 to deepen
-    with open(TEST_CONFIG_ROOT_DIR / "convert_t4_to_deepen.yaml") as f:
+    # before test - convert non-annotated t4 to deepen
+    with open(TEST_CONFIG_ROOT_DIR / "convert_non_annotated_t4_to_deepen.yaml") as f:
         config_dict = yaml.safe_load(f)
     t42d_input_base = osp.join(TEST_ROOT_DIR, config_dict["conversion"]["input_base"])
     t42d_output_base = osp.join(TEST_ROOT_DIR, config_dict["conversion"]["output_base"])